Thủ tục xây dựng ngữ nghĩa tính toán cho LFoC

Một phần của tài liệu Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 74)

của thuộc tính A có cấu trúc phân cấp như trong Hình 2.2, cấu trúc của các tập mờ hình thang trong fs-REP của ℱκ cũng phải có cấu trúc phân cấp để biểu diễn đúng cấu trúc của ℱκ. Trong phần này, một thủ tục được đề xuất để xây dựng một cấu trúc đa mức cho các tập mờ hình thang từ cấu trúc bụi của ℱκ. Thủ tục xác định các đỉnh của tập mờ hình thang từ bộ tham số định lượng của cấu trúc trúc ĐSGT. Ký hiệu thủ tục là là HA-TFS-MG (Hedge Algebra – Trapezoid Fuzzy Set – Multi Granularity).

2.5.1.1. Ý tưởng của thủ tục đề xuất HA-TFS-MG

Với mỗi mức k của cấu trúc tập mờ cần xây dựng, thực hiện xây dựng một phân hoạch mờ mạnh của các tập mờ hình thang biểu diễn cho các hạng từ ở mức

tính riêng k của ℱκ, tức là tập Xk của miền hạng từ thuộc tính A. Do đó, để xây dựng một phân hoạch mờ mạnh, chúng ta chỉ cần xác định các đáy nhỏ của các hình thang. Chúng chính là ngữ nghĩa khoảng hoặc giá trị của ánh xạ định lượng ngữ nghĩa khoảng fAcủacác hạng từ trong Xk.

Ý tưởng sản sinh các tập mờ được tóm lược như sau:

a) Thông tin vào để xác định ngữ nghĩa của thuộc tính A

Các thông tin cần thiết xác định toàn bộ ngữ nghĩa của thuộc tính A gồm có:

o Ngữ nghĩa cú pháp của thuộc tính A: tên của các hạng từ tương ứng với các phần tử sinh c− và c+; các hạng từ hằng 0, W1; các gia tử trong tập H

H+, bảng dấu quan hệ của các gia tử trong H.

o Ngữ nghĩa định lượng của thuộc tính A: các giá trị số làm tham số mờ cho thuộc tính A gồm có m(c+), m(a), aC, và (h), hH thỏa điều kiện

m(0) + m(c−) + m(W) + m(c+) + m(1) = 1 và ∑ℎ∈𝐻𝜇(ℎ)+ 𝜇(ℎ0) = 1.

o Xác định tập các hạng từ trong miền hạng từ của thuộc tính A sẽ cần xây dựng tập mờ hình thang cho chúng.

• Một số nguyên κ, κ > 0, chỉ mức độ tính riêng của LFoC cần xem xét.

• Với mỗi số nguyên k, 1 ≤ kκ, xác định tập Xk gồm các từ có mức tính riêng k, tức là các hạng từ có độ dài k. Sắp xếp các từ này theo thứ tự ngữ nghĩa tăng dần.

b) Xây dựng tập mờ hình thang cho các từ trong ℱκ Với mỗi k = 1 đến κ:

o Xét tập các hạng từ trong Xk. Đặt X1 = {0, c−, W, c+, 1}, xác định 5 khoảng con của [0, 1] tương ứng là ngữ nghĩa khoảng của các từ trong X1 gồm

(0), (h0c−), (W), (h0c+), (1). Nếu k > 1, đặt 𝑋𝑘+ = {𝑥|𝑥 ∈ 𝑋𝑘} ∪ {0, 𝑊,1}, xác định ngữ nghĩa khoảng trong 𝑋𝑘+ gồm (0), (W), (1) và

(h0x), xXk. Khoảng (h0x) này là hình chiếu của đáy nhỏ tập mờ hình thang biểu diễn ngữ nghĩa cho hạng từ x trên miền tham chiếu chuẩn [0, 1] của thuộc tính A.

o Khi các đáy nhỏ của các tập mờ hình thang biểu diễn ngữ nghĩa cho các hạng từ trong X1, 𝑋𝑘+ được xác định, xây dựng các tập mờ hình thang sao cho chúng tạo thành một phân hoạch mạnh trên miền tham chiếu [0, 1]. Tập tất cả các tập mờ trong cấu trúc đa mức gán cho các hạng từ trong ℱκ được ký hiệu là T(ℱκ). Trong Hình 2.3 là một ví dụ về các tập mờ xây dựng cho các hạng từ trong LFoC ℱ3 ở dạng cấu trúc gồm 3 mức. Biểu diễn thành 3 mức tách biệt trong Hình 2.3 để dễ quan sát các phân hoạch mờ mạnh theo từng mức tính riêng. Trên thực tế, tất cả các tập mờ hình thang được xây dựng trên cùng miền tham chiếu chuẩn [0, 1]. Các hạng từ hằng 0, W, 1 được đưa thêm vào trong tập 𝑋𝑘+ để thuận tiện khi mô tả kỹ thuật dựng các hình thang ở mức tính riêng k > 1. Các tập mờ biểu diễn ngữ nghĩa cho các hạng từ hằng này và các tập mờ cho 2 phần tử sinh c− và c+

tạo thành phân hoạch mạnh trên miền tham chiếu chuẩn [0, 1]. Trong Hình 2.3, chúng là các tập mờ biểu diễn bằng nét liền nằm ở phần (a).

2.5.1.2. Thủ tục HA-TFS-MG

Để xây dựng hàm thuộc một tập mờ hình thang chỉ cần xác định hoành độ các đỉnh của hình thang. Ký hiệu L.Trp(x), SmB(x), R.Trp(x) lần lượt là hoành độ đỉnh bên trái của đáy lớn, khoảng hoành độ giữa hai đỉnh đáy nhỏ, hoành độ đỉnh bên phải của đáy lớn. Left(SmB(x)), Right(SmB(x)) lần lượt là đầu mút bên trái, bên phải của khoảng SmB(x). Pre(x), Pos(x) lần lượt là hạng từ ngay trước, ngay sau x

trong tập thứ tự đang xét.

Thủ tục HA-TFS-MG Đầu vào:

Hình 2.3: Ngữ nghĩa tập mờ ở dạng đa mức cho các hạng từ ℱ3 với tập gia tử H

= {L, V} (a) (b) (c) 0 cW1 c+ 1 VcLcLc+ Vc+ VVc+ LVc+ LLc+ VLc+ VVcLVcLLcVLc

- Cấu trúc ĐSGT xác định ngữ nghĩa định tính của các hạng từ trong LFoC ℱA của thuộc tính A: c−, c+, 0, W, 1; H; bảng dấu giữa các gia tử.

- Bộ tham số tính mờ: m(c+), m(a) (a {0, W, 1}), (h) (hH) - Mức tính riêng của LFoC ℱAlà số nguyên κ

Đầu ra:

- Tập các hình thang biểu diễn ngữ nghĩa cho các hạng từ trong ℱA,κ

Begin

1. For each x in {0, c−, W, c+, 1} do

2. SmB(x) = (h0x); // (h0a) = (a) khi a {0, W, 1}

3. If x0 then L.Trp(x) = Right(SmB(Pre(x))) else L.Trp(x) = 0; 4. If x1 then R.Trp(x) = Left(SmB(Pos(x))) else R.Trp(x) = 1; 5. Endfor; // Bắt đầu tại dòng 1

6. For k = 2 to κ do 7. For each x in Xk do 8. SmB(x) = (h0x); 9. For each x in Xk+ do 10. If x not in {0, W, 1} then 11. L.Trp(x) = Right(SmB(Pre(x))) 12. R.Trp(x) = Left(SmB(Pos(x))) 13. Endif;

14. Endfor; // Bắt đầutại dòng9

15. Endfor; // Bắt đầu tại dòng 6

End.

Các dòng lệnh từ 1 đến dòng lệnh 5 thực hiện tính toán hoành độ các đỉnh của tập mờ hình thang cho năm hạng từ ngôn ngữ ở mức 1 là 0, c−, W, c+, 1. Trong đó, dòng lệnh 2 xác định hoành độ của hai đỉnh ở đáy nhỏ, dòng lệnh 3 và 4 xác định hoành độ của hai đỉnh ở đáy lớn. Việc xác định hoành độ này sản sinh ra năm tập mờ tạo thành phân hoạch mạnh trên miền tham chiếu như minh họa trong Hình 2.3-(a). Mỗi vòng lặp của lệnh for bắt đầu tại dòng 6 đến dòng 15 thực hiện xác định hoành độ các đỉnh của các tập mờ hình thang ở từng mức 2, 3, …, κ. Lệnh for

tại dòng 7, 8 xác định hoành độ của hai đỉnh ở đáy nhỏ. Lệnh for bắt đầu tại dòng 9 đến dòng 14 xác định hoành độ của các đỉnh ở đáy lớn. Xem minh họa trong Hình 2.3-(b, c), lần lặp thứ nhất của vòng lặp for bắt đầu tại dòng 6 (ứng với k = 2) xác định bốn tập mờ hình thang trong phần b của Hình 2.3, lần lặp thứ hai (ứng với k = 3) xác định tám tập mờ hình thang trong phần c của Hình 2.3.

2.5.1.3. Đánh giá độ phức tạp của thủ tục HA-TFS-MG

Giả sử cấu trúc ĐSGT cho thuộc tính A có  = |H| gia tử, mức tính riêng của LFoC ℱA là κ. Sau khi tính toán được các khoảng tính mờ (h0x), các giá trị đầu mút của các khoảng (h0x) được sử dụng để gán cho hoành độ cho các đỉnh của hình thang. Việc gán các hoành độ này tại các dòng lệnh trong thân vòng lặp được thực hiện trong thời gian hằng số O(1). Do đó, thời gian thực hiện thủ tục HA-TFS- MG phụ thuộc vào thời gian xác định các khoảng tính mờ (h0x).

Quá trình tính tất cả các khoảng tính mờ (x) (x là hạng từ ở mức k) có thể thực hiện đệ quy theo mức tính riêng của x như sau:

o Với k = 1: Năm khoảng tính mờ của các hạng từ trong tập X1 = {0, c−, W,

c+, 1} dễ dàng được xác định trực tiếp từ bộ tham số định lượng của ĐSGT. Cụ thể như sau: (0) = [0, fm(0)], (c−) = (right((0)), right((0)) +

fm(c−)], (W) = (right((c−)), right((c−)) + fm(W)], (c+) = ((right((W)), right((W)) + fm(c+)], (1) = (1 −fm(1), 1].

o Với k > 1: Với mỗi hạng từ x {0, W, 1}{h0y: y X(k-1)}, x có tính riêng

k – 1, thực hiện xác định các khoảng tính mờ (hx), với hHen, sao cho các khoảng tính mờ này tạo thành một phân hoạch của khoảng tính mờ

(x). Như minh họa trong Hình 2.4, khi đã có khoảng tính mờ (c−), để xác định các khoảng tính mờ (Vc−), (h0c−) và (Lc−) thì chỉ cần xác định đầu mút phải của (Vc−) và đầu mút phải của (h0c−) theo công thức:

Hình 2.4: Các khoảng tính mờ của các hạng từ trong X(3) sinh từ cấu trúc Đại số gia tử với tập gia tử H = {L, V}

right((Vc−)) = left((c−)) + fm(V).fm(c−), right((h0c−)) = right((Vc−)) +

fm(h0).fm(c−).

Do đó, với mỗi hạng từ x ở mức tính riêng k − 1, thời gian tính phân hoạch

(x) thành các khoảng (hx) (hHen) là O(|H|) (với H là tập các gia tử, Hen = H

{h0}). Tập các khoảng (hx) là các khoảng tính mờ của các hạng từ ở mức tính riêng k. Trong đó, khoảng tính mờ (h0x) được sử dụng xác định hoành độ đỉnh của các hình thang, các khoảng tính mờ (hx) (h h0) được tiếp tục phân hoạch để xác định các khoảng tính mờ ở các mức tính riêng cao hơn.

Từ Hình 2.4 cho thấy rằng khi tính tất cả các khoảng tính mờ ở mức tính riêng k = 2, ta có được hai khoảng tính mờ (h0c−) và (h0c+) được sử dụng để xây dựng các hình thang cho các hạng từ c− và c+. Tiếp tục tính các khoảng tính mờ ở mức 3, ta có các khoảng tính mờ của (h0Vc−), (h0Lc−), (h0Lc+) và (h0Vc+) được sử dụng để xây dựng các hình thang cho các hạng từ trong tập X2 = {Vc−, Lc−,

Lc+, Vc+}. Tổng quát hơn, để tính các khoảng tính mờ (h0x), với x ℱA,, cần xác định phân hoạch của tất cả các khoảng tính mờ (x) (x  {0, W, 1}). Do đó, thời gian để tính tất cả các khoảng tính mờ (h0x) là O(|ℱA,|.|H|). Vậy, độ phức tạp của thủ tục HA-TFS-MG là O(|ℱA,|.|H|).

Từ việc phân tích phương pháp tính các khoảng tính mờ mức k dựa trên các khoảng tính mờ mức k – 1, khi cài đặt thủ tục HA-TFS-MG có thể tách riêng thân vòng lặp từ dòng 7 đến dòng 13 thành một thủ tục con, ký hiệu là TFS(k), để xây dựng tập mờ hình thang ở mức k. Với việc lưu trữ các khoảng tính mờ của mức k – 1 đã có, thủ tục con này chỉ cần tính toán với các khoảng tính mờ mức k > 1 mà không cần thực hiện lần lượt từ mức 1 đến mức k. Khi cần tăng mức tính riêng 

thành mức  + 1, trong triển khai cài đặt chỉ cần gọi lại thủ tục con này với tham số tăng lên, tức là TFS( + 1).

Số hạng từ trong LFoC ℱA, gồm có 5 hạng từ mức 1, 2.|H| hạng từ mức 2, 2.|H|2 hạng từ mức 3,… Trong các ứng dụng thực tế, số lượng gia tử trong tập H

2.3 là ví dụ 17 tập mờ biểu diễn cho khung nhận thức ngôn ngữ có mức tính riêng 

= 3, sản sinh từ cấu trúc ĐSGT có hai gia tử H = {L (little), V (very)}.

2.5.2.Tính giải nghĩa được của ngữ nghĩa tính toán trong cấu trúc đa thể

Các hình thang trong tập T(ℱκ) được xây dựng theo thủ tục HA-TFS-MG có quan hệ thứ tự và quan hệ bao hàm. Trong phần này, tác giả luận án sẽ chỉ ra rằng cấu trúc đa thể của các tập mờ hình thang chính là ảnh đẳng cấu của cấu trúc đa ngữ nghĩa 𝑭≤,𝒢𝜅 = (ℱκ, ≤, G). Hơn nữa, tập T(ℱκ) có khả năng mở rộng tương ứng với sự mở rộng của tập ℱκ.

2.5.2.1. Cấu trúc đa ngữ nghĩa của LFoC được bảo toàn a) Quan hệ bao hàm giữa các tập mờ hình thang

Với một tập các tập mờ hình thang T, ký hiệu đơn giản mỗi tập mờ hình thang trong T bởi một bộ ba (a, b, c). Trong đó, [a, c] là khoảng hoành độ của đáy lớn, ký tự b đậm ký hiệu cho khoảng hoành độ đáy nhỏ. Xét tập các tập mờ hình

thang bất kỳ, một quan hệ bao hàm  được định nghĩa như sau:

Định nghĩa 2.5: Cho T là một tập các tập mờ hình thang định nghĩa trên miền tham chiếu chuẩn [0, 1] của thuộc tính A. Một quan hệ bao hàm  trên T được định nghĩa như sau: bất cứ hai tập mờ hình thang (a, b, c) và (a’, b’, c’) trong T

được gọi là thỏa quan hệ (a, b, c)  (a’, b’, c’) khi và chỉ khi [a, c]  [a’, c’]. Tức là tập giá của tập mờ (a, b, c) được bao hàm trong tập giá của tập mờ (a’, b’, c’). Khi đó, chúng ta nói rằng T được trang bị với quan hệ bao hàm  và T trở thành cấu trúc

, ký hiệu là T= (T, ).

Không có gì gây nhầm lẫn khi trong luận án sử dụng cùng ký hiệu  bởi vì nó được định nghĩa cho các đối tượng toán học khác nhau. Về mặt ngữ nghĩa, ký hiệu  muốn minh họa rằng tập các giá trị rời rạc tương thích với hạng từ biểu diễn bởi tập mờ hình thang (a, b, c) hoàn toàn thuộc vào tập các giá trị rời rạc tương thích với hạng từ được biểu diễn bởi (a’, b’, c’). Quan hệ bao hàm  thường là quan hệ bộ phận trong tập T. Các tính chất của quan hệ  được đưa ra trong định lý sau. Phần chứng minh đơn giản sẽ được bỏ qua.

Định lý 2.1: Cho cấu trúc T = (T, ) của tập các tập mờ hình thang T. Khi đó, quan hệ  trong T có tính phản xạ, phản đối xứng và bắc cầu.

b) Quan hệ thứ tự giữa các tập mờ

Quan hệ thứ tự giữa các tập mờ trong định nghĩa (2.6) sau đây được chỉnh sửa từ nghiên cứu [56] bởi chỉ sử dụng duy nhất một trường hợp thay cho cho ba trường hợp.

Định nghĩa 2.6: Cho T là một tập các tập mờ, các đáy nhỏ của bất kỳ hai tập mờ hình thang luôn rời nhau. Khi đó, các khẳng định sau là đúng:

(i) Hai tập mờ hình thang (a, b, c) và (a’, b’, c’) trong tập T được gọi là thỏa quan hệ thứ tự, ký hiệu bởi ≼, tức là (a, b, c) ≼ (a’, b’, c’) nếu điều kiện sau đây là đúng:

(*) Hoặc (a, b, c) = (a’, b’, c’) hoặc b < b’, và ít nhất một trong hai bất đẳng thức

a < a’ hoặc c < c’ là đúng.

(ii) Tập T được trang bị quan hệ thứ tự ≼ được gọi là cấu trúc ≼, ký hiệu là

T≼= (T, ≼).

Điều kiện b < b’ có nghĩa là khoảng giá trị tương ứng với hoành độ hai đỉnh đáy nhỏ của hình thang thứ nhất nằm hoàn toàn bên trái khoảng giá trị tương ứng hoành độ hai đỉnh đáy nhỏ của hình thang thứ hai. Tức là, đầu mút bên phải của khoảng b nhỏ hơn đầu mút bên trái của khoảng b’. Định lý (2.2) sau khẳng định các tính chất của quan hệ thứ tự:

Định lý 2.2: Quan hệ thứ tự ≼ của T≼ định nghĩa trên tập T đã cho trong Định nghĩa 2.6 có tính chất phản xạ, phản đối xứng và bắc cầu.

Chứng minh

Tính phản xạ: Theo điều kiện (*) trong Định nghĩa 2.6, rõ ràng ≼ có tính phản xạ.

Tính phản đối xứng: Giả sử rằng (a, b, c) ≼ (a’, b’, c’) và (a’, b’, c’) ≼ (a, b,

c), suy ra b = b’. Vì các đáy nhỏ của bất cứ hai hình thang khác nhau nào trong T≼ là rời nhau (theo định nghĩa của ánh xạ định lượng khoảng trong ĐSGT mở rộng là ánh xạ 1 – 1 và đẳng cấu về thứ tự). Do đó, ta có (a, b, c) = (a’, b’, c’).

Tính bắc cầu: Giả sử rằng (a1, b1, c1) ≼ (a2, b2, c2) và (a2, b2, c2) ≼ (a3, b3,

c3). Xét bốn trường hợp sau:

Trường hợp 1: Ba hình thang khác biệt nhau và nằm cùng trên một mức tính riêng k. Vì chúng cùng nằm trên một mức tính riêng k, nên chúng tạo thành một phân hoạch mạnh trên miền tham chiếu. Ta có:

{a1} < b1 < {a2, c1} < b2 < {a3, c2} < b3 < {c3} (2.2) Các bất đẳng thức (2.2) là so sánh giữa các tập hợp. Trong một phép so sánh, mọi phần tử thuộc tập ở vế trái nhỏ hơn mọi phần tử thuộc tập ở vế phải.

Theo Định nghĩa 2.6, (a1, b1, c1) ≼ (a3, b3, c3).

Trường hợp 2: Giả sử rằng có hai hình thang Tr1 = (a1, b1, c1) và Tr2 = (a2,

b2, c2) cùng thuộc mức k, hình thang còn lại Tr3 = (a3, b3, c3) nằm ở mức k’ > k. Khi đó, tồn tại một hình thang Tr3’ = (a3’, b3’, c3’) nằm ở mức k; Tr3’ biểu diễn cho từ có tính khái quát hơn từ được biểu diễn bởi Tr3. Nên theo quan hệ bao hàm, ta có [a3, c3]  [a3’, c3’] và a3’a3.

o Nếu Tr3’ khác với Tr1Tr2, thì từ b2 < b3, suy ra Tr2Tr3’. Áp dụng (2.2) cho ba hình thang Tr1, Tr2Tr3’, ta có {a1} < {a3’, c2}. Do đó, a1

Một phần của tài liệu Tóm tắt dữ liệu bằng ngôn ngữ theo cách tiếp cận đại số gia tử (Trang 74)

Tải bản đầy đủ (PDF)

(148 trang)