nghiên cứu một số vấn đề về văn phạm và ngôn ngữ mờ, đặc biệt là văn phạm và ngôn ngữ phi ngữ cảnh mờ, văn phạm max-product phi ngữ cảnh

Nghiên cứu một số tính chất của những hệ thống sinhngôn ngữ mờ, dạng chuẩn tắc của F-CFDS, tập các cây suy dẫn của văn phạmphi ngữ cảnh mờ, ôtômat cây mờ và bộ chuyển đổi cây mờ.. Một vă

Trang 1

A më ®Çu

Trong những năm gần đây, chúng ta đã chứng kiến sự phát triển mạnh

mẽ trong các lĩnh vực nghiên cứu toán học liên quan đến máy tính và tin học.Những phát triển đa dạng của toán học đã trở thành nền tảng cho sự phát triểncủa máy tính và tin học Ngược lại, các tiến bộ trong tin học đã dẫn đến sựphát triển rất mạnh mẽ một số ngành toán học

Vì vậy, toán học đóng vai trò trung tâm trong các cơ sở của tin học.Trong đó lý thuyết ngôn ngữ hình thức và ôtômat đóng một vai trò rất quantrọng Ngôn ngữ hình thức được sử dụng trong việc xây dựng các ngôn ngữlập trình và lý thuyết về các chương trình dịch

Ngôn ngữ hình thức thì rất chính xác trong khi các ngôn ngữ tự nhiênlại đa dạng và không chính xác Để giảm khoảng cách giữa chúng người tađưa tính chất mờ vào cấu trúc ngôn ngữ hình thức

Tiểu luận nhằm nghiên cứu một số vấn đề về văn phạm và ngôn ngữ

mờ, đặc biệt là văn phạm và ngôn ngữ phi ngữ cảnh mờ, văn phạm product phi ngữ cảnh Nghiên cứu một số tính chất của những hệ thống sinhngôn ngữ mờ, dạng chuẩn tắc của F-CFDS, tập các cây suy dẫn của văn phạmphi ngữ cảnh mờ, ôtômat cây mờ và bộ chuyển đổi cây mờ

max-Thực ra, vấn đề văn phạm và ngôn ngữ được sinh bởi văn phạm là mộtlính vực đã được nghiên cứu sâu và ứng dụng mạnh mẽ, đặc biệt là vấn đềvăn phạm và ngôn ngữ mờ Tiểu luận không nhằm trình bày thêm những vấn

đề mới mà chỉ là tóm tắt những kiến thức mà bản thân đã thu nhận được thôngqua thời gian học tập ngắn và tham khảo một số tài liệu

Để hoàn thành được đề tài này, ngoài sự cố gắng nỗ lực của bản thân,chúng tôi được sự giúp đỡ nhiệt tình của PGS.TS Nguyễn Gia Định Dù rấttâm đắc với vấn đề nghiên cứu và đam mê với môn học, nhưng với thời gianhạn chế và khối lượng kiến thức của bản thân còn ít ỏi nên chắc chắn tiểu luậnkhông tránh khỏi những sai sót Chúng tôi xin trân trọng cảm ơn sự giúp đỡquý báu của Quý Thầy và mong muốn đón nhận từ Quý Thầy và các bạn sựgóp ý bổ sung để giúp chúng tôi có cách nhìn đúng hơn về vấn đề cần nghiêncứu đồng thời mong được sự lượng thứ cho những sơ suất trong tiểu luận này

Xin trân trọng cảm ơn!

B Néi dung

1 Ng«n ng÷ mê

Trang 2

Cho T biểu thị một tập các trạng thái kết thúc và N biểu thị một tập

trạng thái không kết thúc sao cho TN= Một ngôn ngữ mờ là một tập con

mờ của T* Cho 1 và 2 là hai ngôn ngữ mờ trên T

Hợp của 1 và 2 là một ngôn ngữ mờ đợc biểu thị bởi 12 và đợc

Cho  là một ngôn ngữ mờ trong T Khi đó tập con mờ  của T* đợc

định nghĩa: (x)={n(x) | n=0,1, } xT* đợc gọi là bao đóng Kleene của



Một văn phạm mờ có thể đợc xem nh một tập các quy tắc để sinh ranhững phần tử của một tập con mờ Một văn phạm mờ, hoặc đơn giản một vănphạm, là một bộ bốn G=(N,T,P,S), trong đó T là một tập các trạng thái kếtthúc, N là một tập các trạng thái không kết thúc (TN=), P là một tập cácquy tắc mờ và SN

Một phần tử của P là biểu thức có dạng: (r    w)=c c>0)=c c>0 (4)trong đó r và w)=c c>0 là những xâu trong (TN)*, c là độ thuộc Ta có thể viết gọn

   sw)=c c>0t swt đợc gọi là suy dẫn trực tiếp từ srt.(5)

Nếu r1, ,rm là các xâu trong (TN)* và r1  c2 r2, , rm-1  c m rm với

c2, ,cm >0 thì r1 đợc gọi là sinh ra rm trong văn phạm G, hoặc rm có thể đợcsinh từ r1 trong văn phạm G Điều này đợc biểu diễn bởi r1  rm

r1  c2 r2, , rm-1  c m rm là một dãy phép suy dẫn từ r1 đến rm (6)Một văn phạm mờ G sinh ra một ngôn ngữ mờ L(G) theo nghĩa: Một

xâu các ký hiệu kết thúc x đợc gọi là thuộc L(G) nếu và chỉ nếu x đợc sinh từ

S Độ thuộc của x trong L(G) là: G(x)=((S,r1)(r1,r2) (rm,x))(7)

Trong đó cận trên nhỏ nhất đợc lấy trên tất cả dãy phép suy dẫn từ S đến

x Nh vậy (7) định nghĩa L(G) nh một tập con mờ của (TN)* Nếu

L(G1)=L(G2) trong nghĩa của tính bằng nhau của tập con mờ thì văn phạm G1

và G2 đợc gọi là tơng đơng

Phơng trình (7) có thể đợc giải thích nh sau:

G(x) là độ thuộc của x trong ngôn ngữ đợc sinh bởi văn phạm G

G(x) là độ lớn của dãy suy dẫn mạnh nhất từ S đến x.

Trang 3

Xét xâu kết thúc x=0 Những dãy suy dẫn có thể đối với xâu này là

2 Các loại văn phạm

Tơng tự với định nghĩa thờng dùng của những văn phạm không mờ, ta

định nghĩa bốn loại văn phạm mờ chủ yếu dới đây:

Văn phạm loại 0: Là văn phạm mà các quy tắc có dạng tổng quát r

c

   w)=c c>0, c>0 trong đó r và w là các xâu trong (TN)*.

Văn phạm loại 1 (cảm ngữ cảnh): Là văn phạm mà các quy tắc có dạng

r1Ar2  cr1w)=c c>0r2, c>0 trong đó r 1 , r 2 và w là các xâu trong (TN)*, AN và

w)=c c>0A Quy tắc S   A cũng thuộc văn phạm loại này

Văn phạm loại 2 (phi ngữ cảnh): Là văn phạm mà các quy tắc có dạng

Định lý 2.1 Nếu G=(N,T,P,S) là văn phạm cảm ngữ cảnh mờ thì G là đệ quy.

Chứng minh: Trớc hết ta chỉ ra rằng đối với một loại văn phạm bất kỳ, cận

trên nhỏ nhất trong (7) có thể đợc lấy trên một tập con của tập hợp tất cả dãy

suy dẫn từ S đến x, đó là tập con của tất cả những dãy suy dẫn không lặp (là

dãy mà trong đó không có ri (i=1 m) xuất hiện hơn một lần)

Giả sử rằng trong dãy suy dẫn

Trang 4

vì vậy C có thể bị xóa mà không ảnh hởng đến cận trên nhỏ nhất trong (7).

Nh vậy ta có thể thay thế định nghĩa (7) của G(x) bằng

G(x) =  {((S,r1), (r1,r2), ,(rm,x)} (9)

trong đó cận trên nhỏ nhất lấy trên tất cả dãy suy dẫn không lặp từ S vào x

Bây giờ ta chỉ ra rằng đối với những văn phạm cảm ngữ cảnh, tập hợp

cận trên nhỏ nhất đợc lấy trong (9) bị giới hạn vào độ dài l 0 của những dãy suy

dẫn, trong đó l 0 phụ thuộc vào x và số lợng các ký hiệu trong (TN)

Nếu G là văn phạm cảm ngữ cảnh thì vì đặc tính không thu hẹp đợc củacác quy trong P nên nó kéo theo: r j r i nếu j>i (10)

Đặt TN =k Vì có tối đa k’ xâu phân biệt trong (TN)* có độ dài l

và vì dãy suy dẫn là không lặp nên từ (10) ta có tổng độ dài của dãy đợc giớihạn bởi l0= 1+k+ +k x

.Tiếp theo ta đa ra một phơng pháp sinh ra tất cả dãy suy dẫn hữu hạn từ

S đến x có độ dài l0 Ta bắt đầu với S và dùng P sinh ra tập Q1 của tất cả cácxâu trong (TN)* có độ dài  x mà có thể sinh từ S trong một bớc Sau đó ta

xây dựng Q2, tập hợp tất cả các chuỗi trong (TN)* có độ dài  x mà có thể

sinh từ S trong hai bớc Lu ý, Q2 đồng nhất với tập tất cả các xâu trong(TN)* với độ dài  x mà đợc sinh trực tiếp từ các xâu trong Q1 Tiếp tụcvới quá trình này, ta xây dựng liên tiếp Q3, Q4, , Qk cho đến khi k=l0 hoặc

Qk= Vì Qi (i=1 k) là tập hữu hạn, ta có thể tìm trong một số hữu hạn của

các tập tất cả các dãy suy dẫn không lặp từ S đến x với độ dài  l0 và vì vậy đểtính toán G(x) bằng sử dụng (9) Sau đó thiết lập một thuật toán để tính toán

G(x) Vì vậy G là đệ quy

3 Văn phạm phi ngữ cảnh mờ

Nhiều kết quả cơ sở trong lý thuyết ngôn ngữ hình thức có thể dễ dàng

đợc mở rộng thành ngôn ngữ mờ Phần này ta đa ra một mở rộng nh vậy trongtrờng hợp những dạng chuẩn tắc của Chomsky và Greibach đối với nhữngngôn ngữ phi ngữ cảnh

Trớc hết, ta xét dạng chuẩn tắc Chomsky đối với ngôn ngữ phi ngữ cảnhmờ

Bất kỳ ngôn ngữ phi ngữ cảnh đợc sinh ra bởi một văn phạm trong đócác quy tắc có dạng A  BC hoặc A a, với A,B,C là ký hiệu không kết

thúc và a là ký hiệu kết thúc Dạng này đợc gọi là dạng chuẩn tắc Chomsky.

Cho G là một văn phạm phi ngữ cảnh mờ Văn phạm này tơng đơng vớimột văn phạm G’ trong đó tất cả quy tắc có dạng A c

  BC, A c

   a, với

c>0 và A,B,C là ký hiệu không kết thúc và a là ký hiệu kết thúc.

Ta xây dựng G’ theo ba giai đoạn:

Thứ nhất, ta xây dựng một văn phạm G1 tơng đơng với G trong đókhông có quy tắc dạng A    B, A,BN

Trang 5

Giả sử rằng trong G ta có quy tắc dạng A   B mà dẫn đến dãy suydẫn dạng: A c1

  B1  c2 B2  c3 c m

  Bm   c m1 B c m2

   r với rN,khi đó ta thay thế tất cả các quy tắc dạng:

A c1

 B1, B1  c2 B2, , Bm   c m1 B trong G bằng các quy tắc đơndạng A c

  r trong đó c = (AB)  (B,r) (11)

trong đó (AB) =  {(A1,B1)   (Am,B)} (12)với cận trên nhỏ nhất đợc lấy trên tất cả dãy suy dẫn không lặp từ A đến B.Suy ra văn phạm kết quả G1 tơng đơng với G

Thứ hai, ta xây dựng một văn phạm G2 tơng đơng với G1 trong đó không

   B1 B2 Bm, c>0 m>2 Ta thay thế tất cả quy tắc này bởiquy tắc

Trang 6

Sau đây ta xét dạng chuẩn tắc Greibach.

Cho G là văn phạm phi ngữ cảnh mờ bất kỳ G tơng đơng với một vănphạm mờ GG trong đó tất cả các quy tắc có dạng A   ar, với A là một ký

hiệu không kết thúc, a là một ký hiệu kết thúc và r là một xâu trong N* Văn

phạm mờ GG là trong dạng chuẩn Greibach Để xây dựng GG ta phải sử dụnghai bổ đề dới đây:

Bổ đề 3.2 Cho G là một văn phạm phi ngữ cảnh mờ

Đặt A   r1Br2 là một quy tắc trong P, với A,BN, và r1, r2(TN)*

Đặt B    w)=c c>01, , B    w)=c c>0k là tập tất cả các quy tắc với B thuộc vế trái

(B-production)

Đặt G1 là văn phạm kết quả từ sự thay thế của mỗi quy tắc có dạng A

   r1Br2 bởi quy tắc A   r1w)=c c>01r2, , A  r1w)=c c>0rr2 trong đó

(A, r1w)=c c>0ir2) = (A, r1w)=c c>0r2)  (B,w)=c c>0i) i=1 k (15)

Khi đó G1 tơng đơng với G

Bổ đề 3.3 Cho G là một văn phạm phi ngữ cảnh mờ

Đặt A  Ari (i=1 k) là những quy tắc trong đó A là ký kiệu bên trái

nhất ở vế phải (A-production)

Đặt A   w)=c c>0j, là những quy tắc còn lại, với ri, w)=c c>0j(TN)*, (i,j=1 k) Gọi G2 là văn phạm kết quả từ việc thay thế A  Ari trong G bằngcác quy tắc: A  w)=c c>0jZ (j=1 m) (16)

Z  ri Z  riZ (i=1 k) (17)Trong đó:

Trang 7

Sau đó, ta sửa những quy tắc dạng Ai   Ajs, s(TN)*, thực hiện

nh vậy đối với tất cả quy tắc, ji Điều này đợc thực hiện nh sau:

Giả sử rằng nó đã đợc thực hiện đối với i k, đó là, nếu

là một quy tắc với i k, thì j>i Để mở rộng thành A k+1 -production, giả sử

rằng Ak+1    Ajs là quy tắc bất kỳ với j<k+1 Sử dụng bổ đề 3.2 và phép thế

đối với Aj vế phải của mỗi A j -production, ta thu đợc bởi sự lặp lại phép thế các

với độ thuộc đã cho bởi mệnh đề 3.2 và 3.3

Với (21) và (22), ký hiệu bên trái nhất của vế phải của bất kỳ quy tắc

đối với Am phải là một ký hiệu kết thúc Tơng tự, đối với Am-1, ký hiệu bên tráinhất của vế phải bắt buộc là Am hoặc ký hiệu kết thúc Sử dụng bổ đề 3.2 thaythế đối với Am, ta thu đợc các quy tắc mà vế phải của nó bắt đầu với ký hiệukết thúc Lặp lại quá trình này đối với Am-2, ,A1, các quy tắc Ai (i=1 m), đợc

đặt vào dạng mà vế phải của chúng bắt đầu là các ký hiệu kết thúc

Tại giai đoạn này, chỉ những quy tắc trong (23) có thể không là trongdạng mong muốn Suy ra ký hiệu bên trái nhất trong trong (23) có thể hoặcmột ký hiệu kết thúc hoặc một trong những Ai (i=1 m) Nếu trờng hợp thứ haithỏa mãn, áp dụng bổ đề 3.2 vào mỗi Zi quy tắc sinh ra các quy tắc của dạngmong muốn Điều này hoàn thành việc xây dựng

Cho T={a,b}, N={A1,A2,A3}, và cho các quy tắc là trong dạng chuẩntắc Chomsky

Trang 8

Tiếp theo, ta áp dụng bổ đề 3.3 vào quy tắc A1    A3A1A3A2, A3   

bA3A2 và A3   a Đa vào Z3 và thay quy tắc A3    A3A1A3A2 bởi A3   

A3A1 và sau đó quy tắc với A2 ở bên trái đợc dùng để thay thế A2 trong quy tắc

A1  0.8 A2A3 Kết quả thu đợc nh sau:

Trang 9

Bớc 3: Hai quy tắc Z3  0.2 A1A3A2 và Z3  0.2 A1A3A2Z3, đợc biến đổi thànhdạng mong muốn bằng cách thế vế phải của mỗi trong năm quy tắc với A1

nằm bên trái đối với sự xuất hiện đầu tiên của A1 Vì vậy Z3  0.2 A1A3A2

Trang 10

Định nghĩa 4.1 Một văn phạm max-product phi ngữ cảnh (CMG) là một bộ

bốn G=(T,N,P,) sao cho thỏa mãn những điều kiện dới đây:

(1)- T và N là những tập rời nhau, hữu hạn và không rỗng

(2)- P là một tập hợp hữu hạn các quy tắc mờ mà mỗi quy tắc có dạng A

Cho G=(T,N,P,) là một CMG Khi đó ta viết xp y(mod w)=c c>0), trong đów)=c c>0=(r1,k1) (r2,k2) (rn,kn), x,y(TN)*, ri=(Ai  p i xi)P, kiN (i=1 n) vàp=p1p2 pn nếu và chỉ nếu tồn tại zi(TN)* (i=0 n) sao cho z0=x, zn=y, và

đối với mỗi i =1,2, ,n, zi thu đợc từ z i-1 bằng cách thay thế sự xuất hiện thứ k i

của Ai trong z i-1 bởi x i Cách viết khác: x0 y(mod w)=c c>0)

Nếu đối với mọi i=1,2, ,n, ki=1 và zi-1=uAiv, trong đó uT*, thì ta viết:xp

L y(mod w)=c c>0) Cách viết khác: x0

L y(mod w)=c c>0)

Rõ ràng, p đợc xác định duy nhất bởi x,y(TN)* và w)=c c>0(PN)* Điều

này cho phép ta định nghĩa, đối với mỗi w)=c c>0(PN)*, hàm w)=c c>0 và L

w)=c c>0 từ(TN)*(TN)* vào 0 sao cho w)=c c>0(x,y)=p nếu và chỉ nếu xp y(mod w)=c c>0) và

L

w)=c c>0(x,y)=p nếu và chỉ nếu xp

L y(mod w)=c c>0)Cho G=(T,N,P,) là một CMG Cho W=PN

ngôn ngữ mờ hữu hạn là một hàm từ S* vào 0

Cho G là CMG Khi đó G là ngôn ngữ mờ đợc sinh ra bởi G và L

G làngôn ngữ mờ đợc sinh ra bởi G chỉ sử dụng suy dẫn trái nhất

G

Chứng minh: Đặt G=(T,N,P,) Nó là đủ để chỉ ra rằng đối với tất cả AN,

xT* và p 0, nếu Ap x(mod w)=c c>0) đối với w)=c c>0(PN)* thì Ap

L x(mod w)=c c>0’) đốivới w)=c c>0’(P{1})* Điều này có thể đợc hoàn thành bởi phơng pháp quy nạptrên x

Định nghĩa 4.5 Cho  là một ngôn ngữ mờ hữu hạn trên T  đợc gọi là một

ngôn ngữ mờ phi ngữ cảnh hữu hạn (CFFL) nếu =G đối với CMG G

Trang 11

Mệnh đề 4.6 Cho  là một CFFL trên T Khi đó =G đối với CMGG=(T,N,P,) sao cho thỏa mãn các tính chất dới đây:

(1)-Tồn tại A0N sao cho (A0)=1 và (A p

  x) P hàm ý A0 khôngxuất hiện trong x

(2) Đối với mọi AN và x(TN)*, (A p1

  x) P và (A p2

  x) Phàm ý p1=p2 >0

(3)- Đối với mọi AN, tồn tại u,vT* và w)=c c>0(PN)* sao cho

nếu và chỉ nếu đối với mọi AN và w)=c c>0(PN)* thì w)=c c>0(A,A)1

gọn G=(T,N,P,A) trong đó P không chứa bất kỳ quy tắc mờ có dạng A p

CMG thu gọn G=(T,N,P,A0), trong đó P không chứa bất kỳ quy tắc mờ códạng A p

  B với A,BN và A p

  A với AN\{A0}

những CMG rút gọn G=(T,N,P0,A0), trong đó A p

  AP0 hàm ý A=A0 Cho

 là hàm từ (TN)*(TN)* vào 0 sao cho đối với mọi s,t(TN)*

(s,t)=

p s otherwise

0(s,t)= 1 s=

otherwise

t P o

Trang 12

Đặt ’ Là hàm từ (TN)*(TN)* vào 0 sao cho đối với mọis,t(TN)*

Đối với mọi w)=c c>0(P)+ và >0 tồn tại w)=c c>00(P0)+ sao cho

w)=c c>0(A,x)>w)=c c>00(A,x)- Hơn nữa đối với mọi w)=c c>00(P0)+ tồn tại w)=c c>0(P)+ saocho w)=c c>00(A,x) w)=c c>0(A,x) Nh vậy =G Mệnh đề đảo dới đây xuất phát từ điều

đó G(x)={{(A)w)=c c>0(A,x) | AN} | w)=c c>0(P)*, w  x }

Định lý 4.11 (Dạng chuẩn tắc chomsky):  là một CFFL hữu hạn nếu và chỉ

nếu =G đối với các CMG rút gọn G=(T,N,P,A0), trong đó P chỉ chứa nhữngquy tắc mờ dạng A0  p A và A p

  a và A p

  BC với A,B,CN và aT

Định lý 4.12 (Dạng chuẩn tắc Greibach):  là một CFFL hữu hạn nếu và chỉ

nếu =G đối với các CMG rút gọn G=(T,N,P,A0), trong đó P chỉ chứa nhữngquy tắc mờ có dạng A0  p A và A p

  az với AN và aT và zN* z 2Nói chung, định lý 4.11 và 4.12 không còn đúng nếu  không hữu hạn,trừ khi ta mở rộng định nghĩa của những quy tắc mờ gồm A p

Đặt G=(T,N,P,A0) là một CMG Khi đó xL(,r,>) nếu và chỉ nếu tồntại w)=c c>0(P0)* sao cho Ap x(mod w)=c c>0) và p>r

Một văn phạm là một bộ bốn G=(T,N,P,A0) trong đó T là ký hiệu kếtthúc và N là ký hiệu không kết thúc, sao cho TN=, P là một tập hữu hạncác quy tắc, và A0N là ký hiệu bắt đầu Suy dẫn theo G, ngôn ngữ L(G) đợcsinh ra bởi G, và những loại văn phạm khác nhau trong phân cấp Chomsky đ-

ợc định nghĩa trong cách thông thờng

Định lý 5.1 L là một ngôn ngữ phi ngữ cảnh (CFL) nếu và chỉ nếu L=L(,r,>)

đối với những CFFL 

G’=(T,N,P’A0) là một văn phạm phi ngữ cảnh, trong đó P’={s  t | (s p

 t)P và p>0} Khi đó nó kéo theo L=L(G’) Dễ dàng chứng minh đợc chiềungợc lại

:Ta*   P(Ta*) Giả sử rằng (A)={A} và (ax)=(a)(x) đối với mọiaT và mọi xT* Thì  đợc gọi là một phép thế Nếu LT*, đặt

(L)=xL(x)

Trang 13

Định nghĩa 5.3 Một bộ chuyển đổi là một bộ sáu M=(X,Q,Y,H,q0,F) với X,

Q và Y là những tập khác rỗng hữu hạn, H là một tập hữu hạn QX*Y*Q,

q0Q là phát biểu ban đầu, FQ là tập các phát biểu chấp nhận

Cho M=(X,Q,Y,H,q0,F) là một bộ chuyển đổi Đối với mỗi xX*, đặtM(x)={yY* |  x1,x2, ,xkX* và y1,y2, ,ykY* và q1,q2, ,qkQ sao chox=x1x2 xk, y=y1y2 yk, qkF và (qi-1,xi,yi,qi)H đối với mọi i =1 k} Đối vớimỗi LX*, đặt M(L)=xLM(x)

Nếu L là một CFL và M là bộ chuyển đổi, thì M(L) là một CFL Nếu L

là một CFL và  là một phép thế sao cho (a) là một CFL đối với tất cả a thì

(L) cũng là một CFL

chặt G và r 0

0 Không mất tính tổng quát, ta giả sử N=N1N2, trong đó

L bằng cách bỏ qua tất cả những từ trong L0 không chứa bất kỳ xuất hiện của

A, và sau đó thay thế đúng một xuất hiện của A bởi x trong những từ còn lại

của L0 Đối với tất cả AN1, đặt L(A)=(GA,0,>), với GA=(TN2,N1,P1, A)

Rõ ràng, L(A) là một CFL đối với tất cả AN1 Đặt  là một phép thếsao cho (A)=L(A) nếu AN1 và (A)={a} nếu aTN2 Đối với tất cả L1,

L2(TN2)* và kN, định nghĩa L1    L2 nếu và chỉ nếu tồn tại

L0’,L1’, ,Lk’(TN2)* sao cho L1=L0’, L2=Lk’ và Li-1    Li đối vớii=1,2 ,k Định nghĩa L1k L2 nếu và chỉ nếu L3(TN2)* sao cho L1k L3 và

L2=L3T* Rõ ràng nếu L1 là một CFL và L1k L2 đối với k thì L2 cũng là mộtCFL Vì r>0 nên tồn tại n sao cho xL hàm ý xL2 đối với các L2T*,trong đó (A0)k L2 và kn Đặt ={L2  T* | (A0)  k L2 đối với k  n và

L2L  } Suy ra L2 hàm ý L2L Do đó L=L2L2 Vì vậy, L là mộtCFL Dễ dàng chứng minh đợc điều ngợc lại (ĐPCM)

p

  x)P hàm ý pc Khi đó L(G,r,>) là hữu hạn đối với tất cả r 0

= G1 đối với CMG G1 mà trong dạng chuẩn tắc Greibach Đặt n là số nguyên

lớn nhất sao cho cn > r Khi đó xL(G1,r,>) hàm ý x  n Nh vậy L(G,r,>)=L(G1,r,>) là hữu hạn (ĐPCM)

Chú ý, Định lý 5.4 và định lý 5.5 còn đúng nếu > đợc thay bởi 

Định lý 5.6 Cho  là một CFFL Khi đó L(,,=) là một CFL.

Trang 14

Chứng minh: Đặt =G, trong đó G=(T,N,P,A0) là một CMG Bằng nhận xétsau định lý 4.11 và 4.12, ta có thể giả sử rằng G là trong dạng chuẩn tắcGreibach với điều kiện là ta cho những quy tắc mờ có dạng s p

  t, với p=

Đối với tất cả aT, đặt a’ một ký hiệu mới và đặt T’={a’| aT} Đối với tất cả x(TN)* đặt x’(T’N)*, trong đó x’ thu đợc từ x bằng cách thay thế tất cả aT trong x bởi a’ Đặt G=(TT’, N, P0,A0) là văn phạm phi ngữ cảnh, trong

tơng ứng aT trong những từ còn lại Vì G là một dạng chuẩn tắc Greibach

nên xL(,,=) nếu và chỉ nếu x đợc sinh ra từ A bằng cách sử dụng ít nhất

Đặt C là họ của tất cả CFL và R là họ của tất cả ngôn ngữ chính quy

Chứng minh: Đặt LC Khi đó L=L(G) đối với văn phạm phi ngữ cảnh

G=(T,N,P,A0) Đặt p=1+r và G’=(T,N,P’,A0) là một CMG, trong đó P’={A

   x | (A  x)P} Suy ra L=L(G,r,>) Do đó LLr Vì vậy CLr

(ĐPCM)

r1 0 Theo định lý 5.7 và 5.8, nó là đủ để xem xét trờng hợp với r1>0 ĐặtG=(T,N,P,) trong đó (A)=r/r1 1(A) đối với tất cả AN Rõ ràngL=L(G,r,>) Do đó LLr Vì vậy L Lr Vì Lr  L nên L= Lr (ĐPCM)

r0

G=(T,N1,P1,A1) Từ theo định lý 4.11 và 4.12, ta có thể giả sử rằng G trongdạng chuẩn tắc Greibach với điều kiện là ta chấp nhận những quy tắc mờ códạng A p

  x, với p= Theo định lý 5.6 L(G,=)=L(G2) đối với ngôn ngữphi ngữ cảnh G2=(T,N2,P2,A2) Giả sử rằng G2 cũng là dạng chuẩn tắcGreibach và N1N2 = Đặt A0TN1N2 Đặt G=(T,N,P,A0) là một CMG,trong đó N=N1N2{A0}, và P gồm tất cả quy tắc mờ có dạng sau:

Rõ ràng, G là trong dạng chuẩn tắc Greibach Vì vậy theo định lý 4.12,

 là hữu hạn Suy ra L=L( ,1/2,>) Dễ dàng chứng minh điều ngợc lại

Trang 15

Định lý 5.11 C là một họ con riêng biệt của L.

{A0,A1,A2},P,A0) là một CMG trong đó P gồm có những quy tắc mờ A0  1

A1A2, A1  2 aA1b, A1  1 ab, A2  0.5 A2, A2  1 c Suy raL=L(G,b,>) Nh vậy LL

Ta viết sp t nếu sp t(mod w)=c c>0) đối với một số w.

r0, tồn tại nN sao cho mọi từ xL với x >n có dạng s1s2s3s4s5, với s2A

và hoặc s1s2 s3s4 s5L đối với mọi k hoặc s1s3s5L

G=(T,N,P,A0) là một CMG trong dạng chuẩn tắc Greibach Đặt N =m, nếux=s1s2s3s4s5L và x >m, suy ra có một AN sao cho A0p1s1At1

p2s1s2At2t1p3s1s2s3s4s5=x, trong đó siT*, tiN*, s2A, Ap4s3, t2p5s4, t1p6s5,

p4p5p6=p3, và p1p2p3>1 Dễ dàng kiểm tra lại rằng (1) nếu p2p51 thì

s1s2 s3s4 s5L k và (2) nếu p2p5<1 thì s1s3s5L (ĐPCM)

L=L(G,1,>), trong đó G=(T,N,P,A) là một CMG trong dạng chuẩn tắcGreibach Đặt N =m và đặt x= s1s2s3s4s5s6s7 L, trong đó x >m2 Khi đó tồntại AN sao cho:

A0  p1 s1At1  p2 s1s2At2t1  p3 s1s2s3At3t2t1  p4 s1s2s3s4s5s6s7 Với siT*,

tiN*, s2s3e, Ap5s3,t3p6s5, t1p7s7, p5p6p7p8=p4, và p1p2p3p4>1 Từ bổ đề 5.12,

ta thấy rằng không phải p2p71 mà cũng không phải p3p61 Tuy nhiên, nếu

p2p7<1 và p3p6<1 thì theo bổ đề 5.12, s1s2s4s6s7 và s1s3s5s6s7 là thuộc L Điềunày là không thể xảy ra Nh vậy LL (ĐPCM)

cây phạm vi (tree domain) hữu hạn nếu những điều kiện sau đợc thỏa mãn:

(1) w)=c c>0U và w)=c c>0=uv hàm ý uU trong đó u,v,w)=c c>0 *;

(2) w)=c c>0nU và mn hàm ý w)=c c>0mU, trong đó w)=c c>0*, m,n,

Cho U là một cây phạm vi hữu hạn Thì tập con U={w)=c c>0U | w)=c c>0.1U}

đ-ợc gọi là nút lá Một cặp (N,T) của những bảng chữ hữu hạn N và T, trong đó

NT= đợc gọi là một bảng chữ đợc săp xếp từng phần Một cây t trên một

bảng chữ đợc sắp xếp từng phần (N;T) là một hàm từ một phạm vi cây hữuhạn U vào NT, đợc viết t: U  (N;T), sao cho:

t(w)=c c>0)N đối với w)=c c>0U\U

t(w)=c c>0)T đối với w)=c c>0U

Tất nhiên, một cây hữu hạn t: U  (N;T), có thể đợc biểu diễn bởimột tập hữu hạn các cặp (w)=c c>0,t(w)=c c>0)), nghĩa là {(w)=c c>0,t(w)=c c>0)) | w)=c c>0U}

Trang 16

Những cây trên (N;T) có thể đợc biểu diễn bằng đồ thị bằng cách xâydựng một cây gốc (trong đó mỗi nút kế tiếp đợc đánh số thứ tự) biểu diễnphạm vi của ánh xạ, và nhãn của những nút với những phần tử của NT biểudiễn giá trị của hàm Trong hình dới đây có hai ví dụ, một ánh xạ, cây bên trái

có miền U={, 1,2,11,12} và giá trị tại 11 là a Cũng chú ý rằng U

(N;T) của giả số hạng trên NT nh tập con nhỏ nhất của[NT{(,)}]* thỏa mãn những điều kiện dới đây:

Ta xét những cây và giả số hạng là sự hình thức hóa tơng đơng Với ví

dụ trên, các cây tơng ứng với giả số hạng dới đây:

A(B(a b)a), f(g(f(ab) g(ab) f(ab))

Sự tơng đơng này có thể đợc thực hiện nh dới đây:

Ta biểu thị tập các cây trên (N;T) bằng DP

(N;T), các phần tử của nó bởi t,

và các giả số hạng tơng ứng với một cây t bởi p(t) hoặc tP

Một tập T mờ của các cây đợc định nghĩa bởi một hàm thuộc T: DP

(N;T)

   [0,1] Tập tất cả các tập mờ của các cây đợc biểu thị bởi F(DP

(N;T))

7 Những hệ thống sinh ngôn ngữ mờ

Định nghĩa 7.1 Một hệ thống sinh ngôn ngữ phi ngữ cảnh mờ (F-CFDS) là bộ

năm S=(N0,N,T,P,0) sao cho những điều kiện dới đây đợc thỏa mãn:

(1)- N0 là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu nút không kết thúc

(2)- N là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu nút

(3)- T là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu lá

B1

11a

111 112

g12

121 122

f2

21 b22

Định dạng
Số trang	33
Dung lượng	1,78 MB