Một số tính chất của ma trận SUP trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất

8 11 0
Một số tính chất của ma trận SUP trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất

Đang tải... (xem toàn văn)

Thông tin tài liệu

Bài viết phát biểu và chứng minh một số tính chất tính gia tăng ma trận độ hỗ trợ, từ đó xác định ma trận độ chính xác và ma trận độ phủ trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất để sinh các luật quyết định có ý nghĩa.

Kỷ yếu Hội nghị KHCN Quốc gia lần thứ XIII Nghiên cứu ứng dụng Công nghệ thông tin (FAIR), Nha Trang, ngày 8-9/10/2020 DOI: 10.15625/vap.2020.00186 MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG THUẦN NHẤT Trịnh Đình Thắng1, Đỗ Thị Lan Anh1, Trần Minh Tuyến2 Viện Công nghệ thông tin, Trường Đại học Sư phạm Hà Nội 2 Đại học Cơng đồn thangdhsp2@hpu2.edu.vn, lananh.cntt.sp2@gmail.com, tuyentm@dhcd.edu.vn TÓM TẮT: Bài báo phát biểu chứng minh số tính chất tính gia tăng ma trận độ hỗ trợ, từ xác định ma trận độ xác ma trận độ phủ khối liệu bổ sung loại bỏ lớp đối tượng để sinh luật định có ý nghĩa Các thuật tốn để tính gia tăng ma trận độ hỗ trợ khối định đề xuất tăng giảm tập đối tượng,… Độ phức tạp thuật toán khối định bổ sung loại bỏ lớp đối tượng phát biểu chứng minh Từ khóa: Ma trận độ hỗ trợ, ma trận độ xác, ma trận độ phủ, khối liệu, khối định I GIỚI THIỆU Khi nghiên cứu mơ hình thuật tốn để khai phá luật định khối liệu với tập đối tượng thay đổi việc tính gia tăng ma trận Sup, Acc, Cov tác giả quan tâm Mục tiêu báo từ mơ hình bổ sung loại bỏ đối tượng khỏi khối liệu, đề xuất chứng minh số tính chất ma trận độ hỗ trợ, độ xác độ phủ khối liệu bổ sung loại bỏ lớp đối tượng Từ tính chất này, báo đề xuất thuật tốn tính gia tăng ma trận tương ứng độ phức tạp tính tốn Các kết việc tính gia tăng ma trận Acc Cov sở để tìm luật định có ý nghĩa khối liệu bổ sung loại bỏ lớp đối tượng II CÁC KHÁI NIỆM CƠ BẢN 2.1 Khối Định nghĩa 2.1 [1] Gọi R = (id; A1, A2, , An) hữu hạn phần tử, id tập số hữu hạn khác rỗng, Ai (i=1 n) thuộc tính Mỗi thuộc tính Ai (i=1 n) có miền giá trị tương ứng dom(Ai) Một khối r R, kí hiệu r(R) gồm số hữu hạn phần tử mà phần tử họ ánh xạ từ tập số id đến miền trị thuộc tính Ai (i=1 n) Nói cách khác: t∈ r(R) ⇔ t = {ti : id → dom(Ai)}i=1 n Ta kí hiệu khối r(R) r(id; A1, A2, , An ), khơng sợ nhầm lẫn ta kí hiệu đơn giản r 2.2 Lát cắt khối Định nghĩa 2.2 [2, 3] Cho R = (id; A1, A2, , An ), r(R) khối R Với x∈ id ta kí hiệu r(Rx) khối với Rx = ({x}; A1, A2, , An ) cho: tx∈ r(Rx) ⇔ tx = {tix = ti } i=1 n , t∈ r(R), t = { ti : id → dom(Ai)}i=1 n , x Khi r(Rx) gọi lát cắt khối r(R) điểm x Sau đây, đơn giản ta sử dụng kí hiệu: x(i) = (x; Ai ) ; id(i) = {x(i) | x ∈ id} Ta gọi x(i) (x ∈ id, i = n) thuộc tính số lược đồ khối R = (id; A1,A2, ,An ) 2.3 Khối thông tin Định nghĩa 2.3 [4] Cho lược đồ khối R = (id; A1, A2, , An ), r khối R Khi khối thơng tin bốn IB = (U, A, V, f) với U tập đối tượng thuộc r gọi không gian đối tượng, A = đối tượng, V = V x ( i ) ∈A n  id (i ) tập thuộc tính số i =1 x( i ) , Vx( i ) tập giá trị đối tượng ứng với thuộc tính số x(i), f hàm thông tin UxA → V thỏa mãn: ∀u∈U, ∀ x(i)∈ A ta có f(u, x(i))∈ Vx ( i ) Khi đó, ta gọi f(u, x(i)) giá trị đối tượng u thuộc tính số x(i) Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến 343 Định nghĩa 2.4 [4] Cho lược đồ khối R = (id; A1, A2, , An ), r khối R, rx lát cắt khối r điểm x∈id Khi lát cắt khối thông tin x bốn IBx = (U, Ax, Vx, fx) với U tập đối tượng thuộc r gọi không gian đối tượng,𝐴𝑥 = ⋃𝑛𝑖=1 𝑥 (𝑖) tập thuộc tính số đối tượng lát cắt x, Vx ( i ) tập giá trị đối tượng ứng với thuộc tính số x , fx hàm thông tin UxAx → Vx thỏa mãn: ∀u∈U,∀ x ∈Ax ta có f(u, x(i))∈ V ( i ), Vx =  V.x (i) (i) (i ) x x( i ) ∈ Ax 2.4 Khối định n id Khi Định nghĩa 2.5 [4] Cho khối thông tin IB k= (U,A,V,f) với U không gian đối tượng, A =  n i =1 (i ) (i ) x , khối thơng tin IB gọi khối định kí A chia thành tập C D cho: C =  x , D =i =k  +1, x∈id (i ) i =1, x∈id hiệu DB=(U,C∪D,V,f), với C tập thuộc tính số điều kiện D tập thuộc tính số định Ta kí hiệu khối định cách đơn giản là: DB = (U, C∪D) Định nghĩa 2.6 [4] Cho khối định DB=(U,C∪D,V,f), với C tập thuộc tính số điều kiện D tập thuộc tính số định Khi lát cắt khối định x (x∈id) bốn DBx = (U, Cx∪Dx, n k Vx, fx ) với U tập đối tượng thuộc r gọi không gian đối tượng, Cx= V x=  x ( i ) ∈Ax Vx ( i ) , (i )  x, Dx= i =k +1 x , Ax= Cx∪Dx, (i ) i =1 Vx( i ) tập giá trị đối tượng ứng với thuộc tính số x(i), fx hàm thơng tin UxAx →Vx thỏa mãn:∀u∈U,∀x(i)∈Ax ta có f(u, x(i))∈ Vx( i ) 2.5 Luật định khối lát cắt Định nghĩa 2.7 [4] Cho khối định DB = (U, C∪D), với U không gian đối tượng: n C= ,D=  i = k +1, x∈id x (i ), Cx = n k (i ) x  x , D = i =k +1 x , x∈id (i ) i =1 Khi đó: U/C = {C1,C2,…,Cm}, U/C x = {C x1 , C x , , C xt } , U/D = {D1,D2,…,Dh}, U/Dx = {D x1 , Dx , , Dxsx } , x tương ứng phân hoạch sinh C, Cx, D, Dx Một luật định khối có dạng: Ci → Dj, i=1 m, j=1 h lát cắt điểm x có dạng: Cxi → Dxj , i=1 tx, j=1 sx Mệnh đề 2.1[4] Cho khối định DB = (U, C∪D), với U không gian đối tượng: k C= , D= , Cx= n  x , Dx=  x (i ), x∈id, (i ) i =1 i = k +1 U/C={C1,C2,…,Cm}, U/Cx= {C x1 , C x , , C xtx } , U/D={D1,D2,…,Dh}, U/Dx= {D x1 , Dx , , Dxs } x Khi đó: ∀Ci∈ U/C,∀Dj∈ U/D ta có: Ci = , Dj = D x∈id xqx với px∈{1,2,…,tx }, qx∈{1,2,…,sx } Định nghĩa 2.8 [4] Cho khối định DB=(U,C∪D), Ci∈U/C, Dj∈U/D, Cxp∈U/Cx, Dxq∈U/Dx, i=1 m, j=1 h, p∈{1,2,…,tx }, q∈{1,2,…,sx }, x∈id Khi đó, độ hỗ trợ, độ xác độ phủ luật định Ci→ Dj khối là: - Độ hỗ trợ: Sup(Ci,Dj) = |Ci∩Dj)|, - Độ xác: Acc(Ci,Dj) = - Độ phủ: Cov(Ci,Dj) = , luật định Cxp → Dxq lát cắt khối điểm x là: - Độ hỗ trợ: Sup(Cxp,Dxq) = |Cxp∩Dxq)|, - Độ xác: Acc(Cxp,Dxq) = - Độ phủ: Cov(Cxp,Dxq) = | C xp ∩ Dxq | | C xp | , | C xp ∩ Dxq | | Dxq | Ta biểu diễn độ đo luật định khối dạng ma trận độ đo sau: - Ma trận độ hỗ trợ: Sup(C, D) = Sup(Ci,Dj)mxn =  Sup (C1 , D1 ) Sup (C1 , Dh )       Sup (C , D ) Sup (C , D )  m m h   MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG… 344 - Ma trận độ xác: Acc(C, D) = Acc(Ci,Dj)mxn = - Ma trận độ phủ:  Acc(C1 , D1 ) Acc(C1 , Dh )       Acc(C , D ) Acc(C , D )  m m h   Cov(C, D) = Cov(Ci,Dj)mxn =  Cov(C1 , D1 ) Cov(C1 , Dh )       Cov(C , D ) Cov(C , D )  m m h   Với luật định lát cắt khối ta có ma trận độ hỗ trợ, độ xác độ phủ tương tự Mệnh đề 2.2 [4] k Cho khối định DB = (U, C∪D), với U không gian đối tượng: C =  i =1, x∈id Khi ∀Ci∈U/C, ∀Dj∈U/D, (i=1 m, j=1 h) ta có: Acc(Ci, Dj ) = Sup(Ci , D j ) h ∑ Sup(C , D ) q =1 i , Cov(Ci, Dj ) = q Sup(Ci , D j ) m ∑ Sup(C p =1 p n x ( i ), D=  x (i ) i = k +1, x∈id , Dj ) III KẾT QUẢ NGHIÊN CỨU 3.1 Tính tốn gia tăng độ hỗ trợ bổ sung, loại bỏ lớp đối tượng khối định n k Cho khối định DB = (U, C∪D, V, f), đó: C =  x ( i ), D =  x ( i ) , U/C = {C1,C2,…,Cm}, i =1, x∈id i = k +1, x∈id U/D={D1,D2,…,Dh} Định nghĩa 3.1 k n Cho khối định DB= (U, C∪D, V, f), đó: C = i =1,x∈id x , D =  x , U/C = {C1,C2,…,Cm}, U/D = = i = k +1, x∈id {D1,D2,…,Dh} Khi lớp đối tượng NX gọi khối định DB đối tượng NX nhận giá trị tất thuộc tính số, nghĩa là: (i ) (i ) f(u, x(i))= f(u’, x(i)) ∀ x(i)∈ C, ∀ u,u’∈ NX • Bổ sung lớp đối tượng vào khối định Giả sử, ta cần bổ sung vào khối định lớp đối tượng gồm N đối tượng, kí hiệu NA Sau bổ sung ta kí hiệu lớp tương đương điều kiện lớp tương đương định tương ứng là: U’/C={C’1,C’2,…,C’m…}, U’/D={D’1,D’2,…,D’h…} Ở i = m lớp tương đương điều kiện Ci C’i có mô tả giống (nghĩa ∀ x(i)∈ C ta có: f(u, x )= f(u’, x(i)) với u∈Ci u’∈C’i), chúng khác số phần tử Hoàn toàn tương tự lớp tương đương định Dj D’j với j = h (i) Khi bổ sung lớp đối tượng NA vào khối định xảy khả sau: 1) Lớp NA bổ sung sinh thêm lớp tương đương điều kiện tập U’/C, kí hiệu C’m+1 gồm N phần tử lớp tương đương định tập U’/D, kí hiệu D’h+1 gồm N phần tử Khi đó, ma trận Sup có thêm dịng m+1 có thêm cột h+1 Mệnh đề 3.1 n k Cho khối định DB= (U, C∪D, V, f), đó: C =  x , D =  x , U/C = {C1,C2,…,Cm}, U/D = i = k +1, x∈id i =1, x∈id {D1,D2,…,Dh} Khi ta bổ sung vào khối lớp đối tượng NA mà sinh thêm lớp tương đương điều kiện tập U’/C, kí hiệu C’m+1 gồm N phần tử lớp tương đương định tập U’/D, kí hiệu D’h+1 gồm N phần tử ta có: (i ) i) Sup(C’m+1, D’h+1) = | C’m+1 ∩ D’h+1| = N, ii) Sup(C’m+1, D’j) = với j = h, iii) Sup(C’i, D’h+1) = với i = m, iv) Sup(C’i, D’j) = Sup(Ci, Dj) với i = m , j = h (i ) Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến 345 Chứng minh i) Khi bổ sung lớp đối tượng NA vào khối định mà sinh thêm lớp tương đương điều kiện tập U’/C, kí hiệu C’m+1 gồm N phần tử lớp tương đương định tập U’/D, kí hiệu D’h+1 gồm N phần tử lớp tương đương C’m+1 D’h+1 chứa số phần tử bổ sung Do vậy, theo định nghĩa độ đo Sup ta có: Sup(C’m+1, D’h+1) = | C’m+1 ∩ D’h+1| = N ii) Vì C’m+1 chứa phần tử bổ sung, D’j với j = h chứa phần tử cũ nên lớp tương đương khơng thể có phần tử chung Từ suy ra: Sup(C’m+1, D’j) = với j = h iii) Tương tự ii), D’h+1 chứa phần tử bổ sung, C’i với ij = m chứa phần tử cũ nên lớp tương đương có phần tử chung Từ suy ra: Sup(C’i, D’h+1) = với i = m iv) Các lớp tương đương điều kiện định cũ với i = m , j = h khơng có thay đổi sau bổ sung nên giá trị Sup chúng không thay đổi Vậy ta có: Sup(C’i, D’j) = Sup(Ci, Dj) với i = m , j = h 2) Lớp NA bổ sung sinh thêm lớp tương đương điều kiện tập U’/C, kí hiệu C’m+1 gồm N phần tử không sinh thêm lớp tương đương định tập U’/D ⇒ ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* Khi đó, ma trận Sup có thêm dịng m+1 không sinh thêm cột Mệnh đề 3.2 n k  x , U/C = {C1,C2,…,Cm}, U/D = Cho khối định DB= (U, C∪D, V, f), đó: C =i =1,x∈id x , D = i = k +1, x∈id {D1,D2,…,Dh} Khi ta bổ sung vào khối lớp đối tượng NA mà sinh thêm lớp tương đương điều kiện tập U’/C, kí hiệu C’m+1 gồm N phần tử khơng sinh thêm lớp tương đương định (i ) (i ) tập U’/D, ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* ta có: i) Sup(C’m+1, D’j*) = | C’m+1 ∩ D’j* | = N, ii) Sup(C’m+1, D’j) = với j = h j ≠ j* iii) Sup(C’i, D’j) = Sup(Ci, Dj) với i = m , j = h Chứng minh i) Khi ta bổ sung vào khối định lớp đối tượng NA mà sinh thêm lớp C’m+1 gồm N phần tử ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* số phần tử chung lớp tương đương N Do theo định nghĩa Sup ta có: Sup(C’m+1, D’j*) = | C’m+1 ∩ D’j* | = N ii) Vì lớp C’m+1 gồm N phần tử bổ sung, lớp D’j với j ≠ j*, j = h lại gồm phần tử cũ nên chúng khơng thể có phần tử chung Từ suy ra: Sup(C’m+1, D’j) = với j = h j ≠ j* iii) Do lớp C’i với i = m gồm phần tử cũ, phần tử lớp D’j với j ≠ j* gồm phần tử cũ, riêng D’j* bổ sung thêm N phần tử Như phần tử chung lớp tương đương C’I D’j với i = m, j = h không thay đổi so với ban đầu Vì ta có: Sup(C’i, D’j) = Sup(Ci, Dj) với i = m , j = h 3) Lớp NA bổ sung không sinh thêm lớp tương đương điều kiện tập U’/C ⇒ ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* Tuy nhiên, lại sinh lớp tương đương định mới, kí hiệu D’h+1 Khi đó, ma trận Sup có thêm cột h+1 không sinh thêm dòng Mệnh đề 3.3 k n  x , U/C = {C1,C2,…,Cm}, U/D = Cho khối định DB= (U, C∪D, V, f), đó: C =i =1,x∈id x , D = i = k +1, x∈id {D1,D2,…,Dh} Khi ta bổ sung vào khối lớp đối tượng NA mà không sinh thêm lớp tương đương (i ) (i ) điều kiện tập U’/C, ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* sinh thêm lớp tương đương định tập U’/D kí hiệu D’h+1 ta có: i) Sup(C’i*, D’h+1) = | C’i* ∩ D’h+1| = N, ii) Sup(C’i, D’h+1) = với i = m i ≠ i* iii) Sup(C’i, D’j) = Sup(Ci, Dj) với i = m , j = h 346 MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG… Chứng minh i) Vì theo giả thiết ta có lớp NA bổ sung không sinh thêm lớp tương đương điều kiện tập U’/C ⇒ ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* Trong lớp tương đương định D’h+1 có N phần tử bổ sung, lớp C’i* lớp D’h+1 có N phần tử chung Điều chứng tỏ rằng: Sup(C’i*, D’h+1) = | C’i* ∩ D’h+1| = N ii) Ta thấy lớp tương đương điều kiện C’i với i = m i ≠ i* chứa phần tử cũ, lớp tương đương định D’h+1 lại chứa phần tử nên C’i D’h+1 khơng thể có phần tử chung Do ta có: Sup(C’i, D’h+1) = với i = m i ≠ i* iii) Vì lớp tương đương định D’j , j = h chứa phần tử cũ, lớp tương đương điều kiện C’i với i = m i ≠ i* chứa phần tử cũ, riêng lớp C’i* bổ sung phần tử nên C’i D’j với i = m , j = h có phần tử chung khơng thay đổi so với trước Từ suy ra: Sup(C’i, D’j) = Sup(Ci, Dj) với i = m, j = h 4) Lớp NA bổ sung không sinh thêm lớp tương đương điều kiện tập U’/C ⇒ ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* không sinh thêm lớp tương đương định tập U’/D ⇒ ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* Khi đó, ma trận Sup khơng sinh thêm dịng khơng sinh thêm cột mới: Mệnh đề 3.4 n k Cho khối định DB= (U, C∪D, V, f), đó: C =  x (i ) , D = x (i ) , U/C = {C1,C2,…,Cm}, U/D = {D1,D2,…,Dh} Khi ta bổ sung vào khối lớp đối tượng NA mà không sinh thêm lớp tương đương i = k +1, x∈id i =1, x∈id điều kiện tập U’/C, ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* không sinh thêm lớp tương đương định tập U’/D, ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* ta có: i) Sup(C’i*, D’j*) = | C’i* ∩ D’j*| = | Ci* ∩ Dj*| + N, ii) Sup(C’i, D’j) = | C’i ∩ D’j| = Sup(Ci, Dj) với i ≠ i* j ≠ j* Chứng minh i) Theo giả thiết bổ sung lớp đối tượng NA không sinh thêm lớp tương đương điều kiện mới, ∃ i*∈ {1,2,…,m} cho NA ⊆ C’i* không sinh thêm lớp tương đương định mới, nghĩa ∃ j*∈ {1,2,…,h} cho NA ⊆ D’j* Do hai lớp tương đương C’i* D’j* có số phần tử chung tăng thêm N Từ ta có: Sup(C’i*, D’j*) = | C’i* ∩ D’j*| = | Ci* ∩ Dj*| + N ii) Với i ≠ i* j ≠ j* lớp tương đương điều kiện lớp tương đương định gồm phần tử cũ mà không bổ sung phần tử nên số phần tử chung chúng không thay đổi so với trước bổ sung Vì ta có: Sup(C’i, D’j) = | C’i ∩ D’j| = Sup(Ci, Dj) với i ≠ i* j ≠ j* • Loại bỏ lớp đối tượng khỏi khối định Khi loại bỏ lớp đối tượng MD khỏi khối định thì: 5) Lớp MD bị loại bỏ thuộc vào lớp tương đương điều kiện tập U/C, ∃ i*∈ {1,2,…,m} cho MD ⊆ Ci* thuộc vào lớp tương đương định tập U/D, ∃ j*∈ {1,2,…,h} cho MD ⊆ Dj* Khi đó, ma trận Sup khơng sinh thêm dịng khơng sinh thêm cột Mệnh đề 3.5 n k Cho khối định DB= (U, C∪D, V, f), đó: C = x , D = x , U/C = {C1,C2,…,Cm}, U/D = i = k +1, x∈id i =1, x∈id {D1,D2,…,Dh} Khi đó, ta loại bỏ từ khối lớp đối tượng MD mà không sinh thêm lớp tương đương (i ) (i ) điều kiện tập U’/C, ∃ i*∈ {1,2,…,m} cho MD ⊆ Ci* không sinh thêm lớp tương đương định tập U’/D, ∃ j*∈ {1,2,…,h} cho ND ⊆ Dj* ta có: i) Sup(C’i*, D’j*) = | C’i* ∩ D’j*| = | Ci* ∩ Dj*| - M, ii) Sup(C’i, D’j) = | C’i ∩ D’j| = Sup(Ci, Dj) Chứng minh với i ≠ i* j ≠ j* Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến 347 i) Theo giả thiết ta có: loại bỏ khỏi khối định lớp đối tượng MD ∃ i*∈ {1,2,…,m} cho MD ⊆ Ci* ∃ j*∈ {1,2,…,h} cho MD ⊆ Dj* Như vậy, lớp tương đương C’i* D’j* bị bớt M phần tử chung thuộc lớp đối tượng MD Do ta có: Sup(C’i*, D’j*) = | C’i* ∩ D’j*| = | Ci* ∩ Dj*| - M ii) Vì lớp tương đương điều kiện định C’i , D’j với i ≠ i* j ≠ j* không bị loại bỏ phần tử nên phần tử chung chúng không bị thay đổi sau loại bỏ Từ suy ra: Sup(C’i, D’j) = | C’i ∩ D’j| = Sup(Ci, Dj) với i ≠ i* j ≠ j* Nhận xét: Trước tính ma trận Acc(C’, D’) Cov(C’, D’) ta thực thao tác xóa dịng/cột ma trận Sup(C’, D’) mà có tồn giá trị có 3.2 Các thuật tốn tính gia tăng ma trận độ hỗ trợ bổ sung loại bỏ lớp đối tượng Các thuật tốn tính ma trận Sup(C, D), Acc(C, D) Cov(C, D) chưa tiến hành bổ sung loại bỏ đối tượng nêu [4], ta xét thuật tốn tính gia tăng ma trận Sup(C’, D’), sau thực thao tác xóa dịng/cột ma trận Sup(C’, D’) mà có tồn giá trị có Từ tính ma trận Acc(C’, D’) Cov(C’, D’) để rút luật định có ý nghĩa Các bước trình thể qua sơ đồ khối sau đây: Bắt đầu Tính ma trận Sup(C, D) Tính ma trận Acc(C’, D’) Cov(C’, D’) Tính gia tăng ma trận Sup(C’, D’) sau bổ sung/loại bỏ lớp đối tượng Loại bỏ dịng/cột tồn giá trị khỏi ma trận Sup(C’, D’) có Sinh luật định có ý nghĩa Kết thúc Thuật tốn 3.1: Tính gia tăng ma trận Sup(C’, D’), bổ sung lớp đối tượng Vào: - Các lớp Ci, Dj - Lớp NA gồm N đối tượng bổ sung - Ma trận Sup(C, D) Ra: Ma trận Sup(C’, D’) Begin // Tìm lớp điều kiện lớp định chứa x thuộc lớp NA with x in AN i* = -1; //lớp điều kiện x tìm end for; for j = to h //tìm lớp định if (x in Dj) then j* = -1; //lớp định x tìm for i = to m //tìm lớp điều kiện if (x in Ci) then i* = i; // tìm thấy x thuộc lớp Ci break; j* = j; //Tìm thấy x thuộc lớp Dj break; end if; // Nếu j* = -1 x không thuộc Dj nào, tạo thêm lớp Dh+1 if j* = -1 then end if; j* = h + 1; // Nếu i* = -1 x khơng thuộc Ci nào, tạo thêm lớp Cm+1 Bổ sung Dh+1 vào U/D; Tạo cột (h + 1) = cho ma trận Sup; if i* = -1 then h = h + 1; i* = m + 1; end if; //Cập nhật tập lớp điều kiện //Cập nhật phần tử ma trận Sup tương ứng Bổsung Cm+1 vào U/C; Sup(Ci*, Dj*) = Sup(Ci*, Dj*) + N Tạo dòng (m + 1) = cho ma trận end if; Sup; m = m + 1; end if; end for; End 348 MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG… Từ thuật toán 3.1 ta thấy: thuật toán xác định đối tượng x bổ sung thuộc vào lớp điều kiện hay lớp định Khi có trường hợp xảy ra, cụ thể sau: (i) Nếu x ∉ Ci x ∉ Dj nào, nghĩa việc bổ sung lớp NA hình thành thêm lớp điều kiện lớp định Khi đó, ma trận Sup bổ sung thêm dòng ký hiệu i* cột ký hiệu j* Ta gán giao dòng i* cột j* N, phần tử khác lại dòng i* cột j* gán (ii) Nếu x ∉ Ci ∃ j* ∈{1,…,h}: x ∈Dj* nghĩa việc bổ sung lớp NA hình thành lớp điều kiện làm ảnh hưởng đến cột j* Suy ra, ma trận Sup bổ sung thêm dòng i* Khi đó, ta tăng giá trị (i*,j*) lên N, phần tử khác lại dòng i* gán cột j* không đổi (iii) Nếu ∃ i*∈{1,…,m}: x∈ Ci* x ∉ Dj nghĩa việc bổ sung lớp NA hình thành lớp định làm ảnh hưởng đến dịng i* Khi đó, ma trận Sup bổ sung thêm cột j* ta tăng giá trị ô (i*,j*) lên N, phần tử lại cột j* gán 0, phần tử dịng i* khơng đổi (iv) Nếu ∃i*∈{1,…,m}: x ∈Ci* ∃ j*∈{1,…,n}: x ∈Dj* nghĩa việc bổ sung lớp NA khơng hình thành lớp điều kiện khơng hình thành lớp định Như vậy, lớp NA làm ảnh hưởng đến dòng i* cột j* ma trận Sup, ta tăng giá trị (i*,j*) lên N, phần tử cịn lại khơng thay đổi Sau hồn thành ta thu ma trận Sup(C’, D’) Thuật tốn 3.2: Tính gia tăng ma trận Sup(C’, D’), loại bỏ lớp đối tượng Vào: - Các lớp Ci, Dj - Lớp MD gồm M đối tượng bị loại bỏ - Ma trận Sup(C, D) Ra: Ma trận Sup(C’, D’) Begin // Tìm lớp điều kiện lớp định chứa x’ with x’ in MD end for; for j=1 to h //tìm lớp định i* = -1; //lớp điều kiện x’ tìm if (x’ in Dj) then j* = -1; //lớp định x’ tìm j* = j; //tìm thấy x’ thuộc lớp Dj for i = to m //tìm lớp điều kiện break; end if; if (x’ in Ci) then end for; i* = i; // tìm thấy x’ thuộc lớp Ci break; //Cập nhật phần tử ma trận Sup tương ứng Sup(Ci*, Dj*)=Sup(Ci*, Dj*) - M; end if; End 3.3 Độ phức tạp thuật tốn thuật tốn tính gia tăng Mệnh đề 3.6: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup bổ sung lớp đối tượng O(|U|) Mệnh đề 3.7: Độ phức tạp thời gian thuật tốn tính gia tăng ma trận Sup loại bỏ lớp đối tượng O(|U|) IV KẾT LUẬN Việc bổ sung loại bỏ lớp đối tượng khối định hay xảy ra, báo phát biểu chứng minh số tính chất đề xuất thuật tốn tính gia tăng ma trận độ hỗ trợ Sup khối định Từ thuật toán đề xuất, độ phức tạp chúng phát biểu chứng minh Những kết nói sở để giúp tính gia tăng ma trận độ xác ma trận độ phủ khối trường hợp riêng nhanh hơn, tiết kiệm thời gian hơn, từ tìm luật định có ý nghĩa khối tập đối tượng khối định có thay đổi Các kết góp phần làm phong phú thêm ứng dụng lí thuyết thiết kế mơ hình sở liệu dạng khối TÀI LIỆU THAM KHẢO [1] Trịnh Đình Thắng, Mơ hình liệu dạng khối, NXB Lao động, Hà Nội, 2011 [2] Trịnh Đình Thắng, Trần Minh Tuyến, “Phép dịch chuyển lược đồ khối vấn đề biểu diễn bao đóng, khóa mơ hình liệu dạng khối”, Kỷ yếu Hội thảo quốc gia lần thứ XIII “Một số vấn đề chọn lọc công nghệ thông tin truyền thơng”, pp 276-286, 08/2010 Trịnh Đình Thắng, Đỗ Thị Lan Anh, Trần Minh Tuyến 349 [3] Trinh Dinh Thang, Tran Minh Tuyen, “Key and key attributes set, non-key attributes set with translation of block schemes”, International Journal of Advanced Research in Computer Science, India, Vol 3, No.3, pp 335-339, 2012 [4] Trịnh Đình Thắng, Trần Minh Tuyến, Đỗ Thị Lan Anh, “Khai phá luật định khối liệu có giá trị thuộc tính thay đổi”, Kỷ yếu hội thảo quốc gia lần thứ XIX: “Một số vấn đề chọn lọc công nghệ thông tin truyền thông”, pp 163-169, 2016 [5] Liu, D., Li, T., Ruan, D., Zou, W., “An incremental approach for inducing knowledge from dynamic information systems”, Fundam Inform., (94), pp 245-260, 2009 [6] Shi, K., Yao, B., “Function S-rough sets and decision law identification” Science in China Series F: Information Sciences 51, pp 499-510, 2008 SOME PROPERTIES OF THE SUPPORT MATRIX ON THE DATA BLOCK WHEN ADDING AND REMOVING HOMOGENEOUS OBJECT CLASSES Trinh Dinh Thang, Do Thi Lan Anh, Tran Minh Tuyen ABSTRACT: The paper states and demonstrates some properties of the support matrix incremental calculation, thereby defining the accuracy matrix and the coverage matrix on the data block when adding and removing homogeneous object layers, to generate meaningful decision laws The algorithms to calculate the increase of the support matrix on the decision block have also been proposed when increasing or decreasing the object set, The complexity of these algorithms on the block determines when adding and removing a homogeneous object class has also been presented and proved correct here ... trợ: Sup( C, D) = Sup( Ci,Dj)mxn =  Sup (C1 , D1 ) Sup (C1 , Dh )       Sup (C , D ) Sup (C , D )  m m h   MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP... thu ma trận Sup( C’, D’) Thuật tốn 3.2: Tính gia tăng ma trận Sup( C’, D’), loại bỏ lớp đối tượng Vào: - Các lớp Ci, Dj - Lớp MD gồm M đối tượng bị loại bỏ - Ma trận Sup( C, D) Ra: Ma trận Sup( C’,... N Tạo dòng (m + 1) = cho ma trận end if; Sup; m = m + 1; end if; end for; End 348 MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG… Từ thuật toán 3.1 ta

Ngày đăng: 01/10/2021, 15:16

Mục lục

  • MỘT SỐ TÍNH CHẤT CỦA MA TRẬN SUP TRÊN KHỐI DỮ LIỆU

  • KHI BỔ SUNG VÀ LOẠI BỎ LỚP ĐỐI TƯỢNG THUẦN NHẤT

  • Trịnh Đình Thắng1, Đỗ Thị Lan Anh1, Trần Minh Tuyến2

  • 1Viện Công nghệ thông tin, Trường Đại học Sư phạm Hà Nội 2

  • 2Đại học Công đoàn

  • thangdhsp2@hpu2.edu.vn, lananh.cntt.sp2@gmail.com, tuyentm@dhcd.edu.vn

  • TÓM TẮT: Bài báo phát biểu và chứng minh một số tính chất tính gia tăng ma trận độ hỗ trợ, từ đó xác định ma trận độ chính xác và ma trận độ phủ trên khối dữ liệu khi bổ sung và loại bỏ lớp đối tượng thuần nhất để sinh các luật quyết định có ý nghĩa. ...

  • I. GIỚI THIỆU

  • Khi nghiên cứu mô hình và thuật toán để khai phá các luật quyết định trên khối dữ liệu với tập đối tượng thay đổi thì việc tính gia tăng các ma trận Sup, Acc, Cov luôn được các tác giả quan tâm. Mục tiêu của bài báo này là từ mô hình bổ sung và loại ...

  • II. CÁC KHÁI NIỆM CƠ BẢN

  • Định nghĩa 2.1 [1] Gọi R = (id; A1, A2, ..., An) là một bộ hữu hạn các phần tử, trong đó id là tập chỉ số hữu hạn khác rỗng, Ai (i=1..n) là các thuộc tính. Mỗi thuộc tính Ai (i=1..n) có miền giá trị tương ứng là dom(Ai). Một khối r trên R, kí hiệu r...

  • Nói một cách khác: t( r(R) ( t = {ti : id ( dom(Ai)}i=1..n.

  • Ta kí hiệu khối đó là r(R) hoặc r(id; A1, A2,..., An ), đôi khi nếu không sợ nhầm lẫn ta kí hiệu đơn giản là r.

  • 2.2. Lát cắt của khối

  • Định nghĩa 2.2 [2, 3]

  • Cho R = (id; A1, A2,..., An ), r(R) là một khối trên R. Với mỗi x( id ta kí hiệu r(Rx) là một khối với Rx = ({x}; A1, A2,..., An ) sao cho:

  • tx( r(Rx) ( tx = {tix = ti } i=1..n , ở đây t( r(R), t = { ti : id ( dom(Ai)}i=1..n ,

  • x

  • Khi đó r(Rx) được gọi là một lát cắt trên khối r(R) tại điểm x.

  • Sau đây, để cho đơn giản ta sử dụng các kí hiệu: x(i) = (x; Ai ) ; id(i) = {x(i) | x ( id}. Ta gọi x(i) (x ( id, i = 1..n) là các thuộc tính chỉ số của lược đồ khối R = (id; A1,A2,...,An ).

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan