Chương 2 CẬP NHẬT QUYẾT ĐỊNH BA NHÁNH TRONG HỆ THÔNG
2.2 Khảo sát xu hướng thay đổi của xác suất có điều kiện
2.2.2 Sự thay đổi của các xác suất có điều kiện khi thay đổi các giá trị thuộc tính của các đối tượng
Trong phần này, luận án tập trung vào nghiên cứu thay đổi xác suất có điều kiện khi các giá trị thuộc tính của một đối tượng thay đổi theo thời gian.
Đầu tiên, luận án trình bày trường hợp trong đó thay đổi giá trị thuộc tính điều kiện hoặc giá trị thuộc tính quyết định của một đối tượng. Sau đó, trình bày sự thay đổi của xác suất khi cả giá trị thuộc tính điều kiện và quyết định của đối tượng cùng thay đổi [CT4].
2.2.2.1 Giá trị thuộc tính điều kiện của một đối tượng thay đổi trên một thuộc tính
Khi giá trị thuộc tính điều kiện của đối tượng 𝑥 thay đổi, các lớp dung sai được cập nhật như sau:
𝑈( )⁄𝑇𝑂𝐿( ) =
⎩⎪
⎨
⎪⎧ 𝑇( ); … ; 𝑇( ) , 𝑛ế𝑢 ∃𝑥 ∈ 𝑈, ∀𝑎 ∈ 𝑃, 𝑎(𝑥) = 𝑎(𝑥 ) ∨ (𝑎(𝑥) = " ∗ ")
∨ (𝑎(𝑥 ) = " ∗ ")
𝑇( ); … ; 𝑇( ) , 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.18)
Trong đó
𝑇( ) =
⎩⎪
⎨
⎪⎧𝑇( )− {𝑥 }, 𝑛ế𝑢 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑇( ) 𝑇( )∪ {𝑥 }, 𝑛ế𝑢 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝑇( )
𝑇( ), 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.19)
Với 1 ≤ 𝑖 ≤ 𝑛
Tại thời điểm 𝑡 + 1, nếu 𝑥 không thuộc bất kỳ một lớp dung sai sẵn có nào thì coi 𝑥 là một lớp mới.
Khi giá trị thuộc tính điều kiện trên một thuộc tính của đối tượng thay đổi, xác suất có điều kiện có thể tăng, giảm hoặc không thay đổi. Những trường hợp này được xem xét trong các mệnh đề sau.
Mệnh đề 2.2. Xét hệ thông tin 𝐼𝐼𝑆 = (𝑈, 𝐴 = 𝐶 ∪ 𝐷, 𝑉, 𝑓) trong đó 𝑈 = {𝑥 ; 𝑥 ; … ; 𝑥 }, 𝑃 ⊆ 𝐴, 𝑋 ⊆ 𝑈, 𝑇𝑂𝑅 là quan hệ dung sai trên 𝑃. Giả sử tồn tại 𝑥 ∈ 𝑈 sao cho giá trị thuộc tính điều kiện của 𝑥 thay đổi trên thuộc tính 𝑎 ∈ 𝐶 từ thời điểm 𝑡 đến thời điểm 𝑡 + 1, tức là, 𝑎 (𝑥 )( ) ≠ 𝑎 (𝑥 )( ). Khi đó
Nếu 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝑇( ) thì 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
Nếu
(𝑖)𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝑋 (𝑖𝑖)𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑋 Thì 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
Nếu
(𝑖𝑖𝑖)𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∉ 𝑋 (𝑖𝑣)𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∈ 𝑋 Thì 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
Chứng minh
Nếu 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝑇( ) thì 𝑇( ) = 𝑇( ) .
Vậy 𝑃𝑟 𝑋 𝑇⁄ ( ) = 𝑃𝑟 𝑋 𝑇⁄ ( ) hay 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
(i) Nếu 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝑋
Thì 𝑇( ) = 𝑇( ) − 1 và 𝑋 ∩ 𝑇( ) = 𝑋 ∩ 𝑇( ) − 1.
Do đó 𝑃𝑟 𝑋 𝑇⁄ ( ) < 𝑃𝑟 𝑋 𝑇⁄ ( ) hay 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
(ii) Nếu 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑋
Thì 𝑇( ) = 𝑇( ) + 1 và 𝑋 ∩ 𝑇( ) = 𝑋 ∩ 𝑇( ) .
Do đó 𝑃𝑟 𝑋 𝑇⁄ ( ) < 𝑃𝑟 𝑋 𝑇⁄ ( ) hay 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
(iii) Nếu 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝑋
Thì 𝑇( ) = 𝑇( ) − 1 và 𝑋 ∩ 𝑇( ) = 𝑋 ∩ 𝑇( ) .
Do đó 𝑃𝑟 𝑋 𝑇⁄ ( ) > 𝑃𝑟 𝑋 𝑇⁄ ( ) hay 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
(iv) Nếu 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∈ 𝑋
Thì 𝑇( ) = 𝑇( ) + 1 và 𝑋 ∩ 𝑇( ) = 𝑋 ∩ 𝑇( ) + 1.
Do đó 𝑃𝑟 𝑋 𝑇⁄ ( ) > 𝑃𝑟 𝑋 𝑇⁄ ( ) hay 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
2.2.2.2 Giá trị thuộc tính quyết định của một đối tượng thay đổi trên một thuộc tính
Trong trường hợp này, vì chỉ có giá trị thuộc tính quyết định của đối tượng thay đổi, nên chỉ thay đổi các lớp quyết định còn các lớp dung sai không thay đổi. Do đó, chúng ta chỉ cần cập nhật các lớp quyết định để xem xét xu hướng thay đổi của xác suất có điều kiện.
Khi giá trị thuộc tính quyết định của đối tượng 𝑥 thay đổi, các lớp quyết định được cập nhật như sau:
𝑈( )⁄𝐷( ) =
⎩
⎨
⎧ 𝐷( ); … ; 𝐷( ) , 𝑛ế𝑢 ∃𝑥 ∈ 𝑈,
∀𝑑 ∈ 𝐷, 𝑑(𝑥) = 𝑑(𝑥 )
𝐷( ); … ; 𝐷( ) , 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.20)
Trong đó
𝐷( ) =
⎩⎪
⎨
⎪⎧𝐷( ) − {𝑥𝑘}, 𝑛ế𝑢 𝑥𝑘 ∈ 𝐷( ) ∧𝑥𝑘 ∉ 𝐷( ) 𝐷( )⋃{𝑥 }, 𝑛ế𝑢 𝑥 ∉ 𝐷( )∧ 𝑥 ∈ 𝐷( )
𝐷( ), trong trường hợp còn lại
(2.21)
Với 1 ≤ 𝑗 ≤ 𝑚.
Khi giá trị thuộc tính quyết định của đối tượng xk thay đổi, nếu giá trị thuộc tính quyết định mới này không thuộc về bất kỳ lớp quyết định hiện có nào, thì 𝑑(𝑥 ) sẽ có dạng một lớp mới.
Dựa trên việc cập nhật các lớp quyết định như trên, dễ dàng thấy rằng, chỉ có một giả định rằng xác suất có điều kiện có xu hướng tăng hoặc giảm, các trường hợp khác xác suất có điều kiện không thay đổi. Chúng được thể hiện trong mệnh đề sau.
Mệnh đề 2.3. Xét hệ thông tin 𝐼𝐼𝑆 = (𝑈, 𝐴 = 𝐶 ∪ 𝐷, 𝑉, 𝑓) trong đó 𝑈 = {𝑥 ; 𝑥 ; … ; 𝑥 }, 𝑃 ⊆ 𝐴, 𝑇𝑂𝑅 là quan hệ dung sai trên 𝑃. Giả sử giá trị thuộc tính quyết định của 𝑥 thay đổi trên thuộc tính 𝑎 ∈ 𝐶 từ thời điểm t đến thời điểm 𝑡 + 1, tức là, 𝑑(𝑥 )( ) ≠ 𝑑(𝑥 )( ). Khi đó
Nếu
(𝑖) 𝑥 ∈ 𝐷( )∧ 𝑥 ∉ 𝐷( )∧ 𝑥 ∉ 𝑇 (𝑖𝑖) 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∈ 𝐷( )∧ 𝑥 ∉ 𝑇 (𝑖𝑖𝑖) 𝑥 ∉ 𝐷( )∧ 𝑥 ∉ 𝐷( )
Thì 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
Nếu
(𝑖𝑣) 𝑥 ∉ 𝐷( )∧ 𝑥 ∈ 𝐷( )∧ 𝑥 ∈ 𝑇 Thì 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡)
Nếu
(𝑣) 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∉ 𝐷( )∧ 𝑥 ∈ 𝑇 Thì 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
Chứng minh
(𝑖) 𝑥 ∈ 𝐷( )∧ 𝑥 ∉ 𝐷( )∧ 𝑥 ∉ 𝑇 Thì 𝐷( ) ∩ 𝑇 = 𝐷( ) ∩ 𝑇
Nên 𝑃𝑟 𝐷( ) 𝑇 = 𝑃𝑟 𝐷( ) 𝑇 hay 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
Các trường hợp (ii) và (iii) được chứng minh tương tự (i).
(𝑖𝑣) 𝑥 ∉ 𝐷( )∧ 𝑥 ∈ 𝐷( )∧ 𝑥 ∈ 𝑇 Thì 𝐷( ) ∩ 𝑇 = 𝐷( ) ∩ 𝑇 + 1.
Nên 𝑃𝑟 𝐷( ) 𝑇 > 𝑃𝑟 𝐷( ) 𝑇 hay 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
(𝑣) 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∉ 𝐷( )∧ 𝑥 ∈ 𝑇
Thì 𝐷( ) ∩ 𝑇 = 𝐷( ) ∩ 𝑇 − 1
Nên 𝑃𝑟 𝐷( ) 𝑇 < 𝑃𝑟 𝐷( ) 𝑇 hay 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
2.2.2.3 Giá trị thuộc tính điều kiện và giá trị thuộc tính quyết định của một đối tượng cùng thay đổi
Trong trường hợp này, cả các lớp dung sai và các lớp quyết định đều thay đổi. Do đó, để xem xét xu hướng thay đổi của xác suất có điều kiện, chúng ta cần cập nhật đồng thời các lớp dung sai và các lớp quyết định.
Giả sử tại thời điểm 𝑡 + 1, cả giá trị thuộc tính điều kiện và giá trị thuộc tính quyết định của đối tượng 𝑥 thay đổi, các lớp dung sai và quyết định được cập nhật như sau:
𝑈( )⁄𝑇𝑂𝐿( ) =
⎩
⎪
⎨
⎪
⎧ 𝑇( )
,…, , 𝑛ế𝑢 ∃𝑥 ∈ 𝑈, ∀𝑎 ∈ 𝑃, 𝑎(𝑥) = 𝑎(𝑥 ) ∨ (𝑎(𝑥) = " ∗ ")
∨ (𝑎(𝑥 ) = " ∗ ") 𝑇( )
,…, , 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.22)
Trong đó
𝑇( ) =
⎩⎪
⎨
⎪⎧𝑇( ) − {𝑥 }, 𝑛ế𝑢 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝑇( ) 𝑇( )⋃{𝑥 } 𝑛ế𝑢 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∈ 𝑇( )
𝑇( ), 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.23)
Với 1 ≤ 𝑖 ≤ 𝑛.
𝑈( )⁄𝐷( ) =
⎩⎪
⎨
⎪⎧ 𝐷( )
,…, , 𝑛ế𝑢 ∃𝑥 ∈ 𝑈,
∀𝑑 ∈ 𝐷, 𝑑(𝑥) = 𝑑(𝑥 ) 𝐷( )
,…, , 𝑡𝑟𝑜𝑛𝑔 𝑡𝑟ườ𝑛𝑔 ℎợ𝑝 𝑐ò𝑛 𝑙ạ𝑖
(2.24)
Trong đó
𝐷( ) =
⎩⎪
⎨
⎪⎧𝐷( )− {𝑥 }, 𝑛ế𝑢 𝑥 ∈ 𝐷( )∧ 𝑥 ∉ 𝐷( ) 𝐷( )∪ {𝑥 }, 𝑛ế𝑢 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∈ 𝐷( )
𝐷( ), trong trường hợp còn lại
(2.25)
Với 1 ≤ 𝑗 ≤ 𝑚
Khi đối tượng 𝑥 đồng thời thay đổi giá trị thuộc tính điều kiện và giá trị thuộc tính quyết định, có một trường hợp mà giá trị thuộc tính mới của đối tượng 𝑥 không thuộc về bất kỳ lớp dung sai hoặc lớp quyết định hiện có nào.
Trong trường hợp này, 𝑥 sẽ tạo thành một lớp mới, tương ứng.
Vì cả giá trị thuộc tính điều kiện và quyết định thay đổi, các lớp dung sai và các lớp quyết định cũng thay đổi theo. Trong trường hợp này, xu hướng thay đổi của xác suất có điều kiện sẽ được phân tích trong mệnh đề sau:
Mệnh đề 2.4. Xét hệ thông tin 𝐼𝐼𝑆 = (𝑈, 𝐴 = 𝐶 ∪ 𝐷, 𝑉, 𝑓) trong đó 𝑈 = {𝑥 ; 𝑥 ; … ; 𝑥 }, 𝑃 ⊆ 𝐴, 𝑇𝑂𝑅 là quan hệ dung sai trên 𝑃. Giả sử tồn tại 𝑥 ∈ 𝑈, 𝑎 ∈ 𝐶 và 𝑑 ∈ 𝐷 để 𝑎 (𝑥 )( ) ≠ 𝑎 (𝑥 )( ) và 𝑑(𝑥 )( ) ≠ 𝑑(𝑥 )( ). Khi đó
Nếu
(𝑖) 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ; (𝑖𝑖) 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ; (𝑖𝑖𝑖) 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝐷( ) . Thì 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
Nếu
(𝑖𝑣) 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ; (𝑣) 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ; (𝑣𝑖) 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝐷( ) .
Thì 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡)
Nếu
(𝑣𝑖𝑖) 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ; (𝑣𝑖𝑖𝑖) 𝑥 ∈ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∈ 𝐷( ) ; (𝑖𝑥) 𝑥 ∉ 𝑇( ) ∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∈ 𝑇( )∧ 𝑥 ∈ 𝐷( ) . Thì 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
Chứng minh
(𝑖) 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) Thì 𝐷( ) ∩ 𝑇( ) = 𝐷( ) ∩ 𝑇( ) và 𝑇( ) = 𝑇( )
Nên 𝑃𝑟 𝐷( ) 𝑇( ) = 𝑃𝑟 𝐷( ) 𝑇( ) hay 𝑃𝑟(𝑡 + 1) = 𝑃𝑟(𝑡).
(ii) và (iii) chứng minh trương tự (i).
(𝑖𝑣) 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∈ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) Thì 𝐷( ) ∩ 𝑇( ) = 𝐷( ) ∩ 𝑇( ) − 1 và 𝑇( ) = 𝑇( ) − 1 Nên 𝑃𝑟 𝐷( ) 𝑇( ) < 𝑃𝑟 𝐷( ) 𝑇( ) hay 𝑃𝑟(𝑡 + 1) < 𝑃𝑟(𝑡).
(v) và (vi) chứng minh trương tự (i).
(𝑣𝑖𝑖) 𝑥 ∈ 𝑇( ) ∧ 𝑥 ∉ 𝐷( ) ∧ 𝑥 ∉ 𝑇( )∧ 𝑥 ∉ 𝐷( ) Thì 𝐷( ) ∩ 𝑇( ) = 𝐷( ) ∩ 𝑇( ) và 𝑇( ) = 𝑇( ) − 1 Nên 𝑃𝑟 𝐷( ) 𝑇( ) > 𝑃𝑟 𝐷( ) 𝑇( ) hay 𝑃𝑟(𝑡 + 1) > 𝑃𝑟(𝑡).
(viii) và (ix) chứng minh trương tự (i).