Nghiên cứu một số tính chất của những hệ thống sinhngôn ngữ mờ, dạng chuẩn tắc của F-CFDS, tập các cây suy dẫn của văn phạmphi ngữ cảnh mờ, ôtômat cây mờ và bộ chuyển đổi cây mờ.. Một vă
Trang 1A më ®Çu
Trong những năm gần đây, chúng ta đã chứng kiến sự phát triển mạnh
mẽ trong các lĩnh vực nghiên cứu toán học liên quan đến máy tính và tin học.Những phát triển đa dạng của toán học đã trở thành nền tảng cho sự phát triểncủa máy tính và tin học Ngược lại, các tiến bộ trong tin học đã dẫn đến sựphát triển rất mạnh mẽ một số ngành toán học
Vì vậy, toán học đóng vai trò trung tâm trong các cơ sở của tin học.Trong đó lý thuyết ngôn ngữ hình thức và ôtômat đóng một vai trò rất quantrọng Ngôn ngữ hình thức được sử dụng trong việc xây dựng các ngôn ngữlập trình và lý thuyết về các chương trình dịch
Ngôn ngữ hình thức thì rất chính xác trong khi các ngôn ngữ tự nhiênlại đa dạng và không chính xác Để giảm khoảng cách giữa chúng người tađưa tính chất mờ vào cấu trúc ngôn ngữ hình thức
Tiểu luận nhằm nghiên cứu một số vấn đề về văn phạm và ngôn ngữ
mờ, đặc biệt là văn phạm và ngôn ngữ phi ngữ cảnh mờ, văn phạm product phi ngữ cảnh Nghiên cứu một số tính chất của những hệ thống sinhngôn ngữ mờ, dạng chuẩn tắc của F-CFDS, tập các cây suy dẫn của văn phạmphi ngữ cảnh mờ, ôtômat cây mờ và bộ chuyển đổi cây mờ
max-Thực ra, vấn đề văn phạm và ngôn ngữ được sinh bởi văn phạm là mộtlính vực đã được nghiên cứu sâu và ứng dụng mạnh mẽ, đặc biệt là vấn đềvăn phạm và ngôn ngữ mờ Tiểu luận không nhằm trình bày thêm những vấn
đề mới mà chỉ là tóm tắt những kiến thức mà bản thân đã thu nhận được thôngqua thời gian học tập ngắn và tham khảo một số tài liệu
Để hoàn thành được đề tài này, ngoài sự cố gắng nỗ lực của bản thân,chúng tôi được sự giúp đỡ nhiệt tình của PGS.TS Nguyễn Gia Định Dù rấttâm đắc với vấn đề nghiên cứu và đam mê với môn học, nhưng với thời gianhạn chế và khối lượng kiến thức của bản thân còn ít ỏi nên chắc chắn tiểu luậnkhông tránh khỏi những sai sót Chúng tôi xin trân trọng cảm ơn sự giúp đỡquý báu của Quý Thầy và mong muốn đón nhận từ Quý Thầy và các bạn sựgóp ý bổ sung để giúp chúng tôi có cách nhìn đúng hơn về vấn đề cần nghiêncứu đồng thời mong được sự lượng thứ cho những sơ suất trong tiểu luận này
Xin trân trọng cảm ơn!
B Néi dung
1 Ng«n ng÷ mê
Trang 2Cho T biểu thị một tập các trạng thái kết thúc và N biểu thị một tập
trạng thái không kết thúc sao cho TN= Một ngôn ngữ mờ là một tập con
mờ của T* Cho 1 và 2 là hai ngôn ngữ mờ trên T
Hợp của 1 và 2 là một ngôn ngữ mờ đợc biểu thị bởi 12 và đợc
Cho là một ngôn ngữ mờ trong T Khi đó tập con mờ của T* đợc
định nghĩa: (x)={n(x) | n=0,1, } xT* đợc gọi là bao đóng Kleene của
Một văn phạm mờ có thể đợc xem nh một tập các quy tắc để sinh ranhững phần tử của một tập con mờ Một văn phạm mờ, hoặc đơn giản một vănphạm, là một bộ bốn G=(N,T,P,S), trong đó T là một tập các trạng thái kếtthúc, N là một tập các trạng thái không kết thúc (TN=), P là một tập cácquy tắc mờ và SN
Một phần tử của P là biểu thức có dạng: (r w)=c c>0)=c c>0 (4)trong đó r và w)=c c>0 là những xâu trong (TN)*, c là độ thuộc Ta có thể viết gọn
sw)=c c>0t swt đợc gọi là suy dẫn trực tiếp từ srt.(5)
Nếu r1, ,rm là các xâu trong (TN)* và r1 c2 r2, , rm-1 c m rm với
c2, ,cm >0 thì r1 đợc gọi là sinh ra rm trong văn phạm G, hoặc rm có thể đợcsinh từ r1 trong văn phạm G Điều này đợc biểu diễn bởi r1 rm
r1 c2 r2, , rm-1 c m rm là một dãy phép suy dẫn từ r1 đến rm (6)Một văn phạm mờ G sinh ra một ngôn ngữ mờ L(G) theo nghĩa: Một
xâu các ký hiệu kết thúc x đợc gọi là thuộc L(G) nếu và chỉ nếu x đợc sinh từ
S Độ thuộc của x trong L(G) là: G(x)=((S,r1)(r1,r2) (rm,x))(7)
Trong đó cận trên nhỏ nhất đợc lấy trên tất cả dãy phép suy dẫn từ S đến
x Nh vậy (7) định nghĩa L(G) nh một tập con mờ của (TN)* Nếu
L(G1)=L(G2) trong nghĩa của tính bằng nhau của tập con mờ thì văn phạm G1
và G2 đợc gọi là tơng đơng
Phơng trình (7) có thể đợc giải thích nh sau:
G(x) là độ thuộc của x trong ngôn ngữ đợc sinh bởi văn phạm G
G(x) là độ lớn của dãy suy dẫn mạnh nhất từ S đến x.
Trang 3Xét xâu kết thúc x=0 Những dãy suy dẫn có thể đối với xâu này là
2 Các loại văn phạm
Tơng tự với định nghĩa thờng dùng của những văn phạm không mờ, ta
định nghĩa bốn loại văn phạm mờ chủ yếu dới đây:
Văn phạm loại 0: Là văn phạm mà các quy tắc có dạng tổng quát r
c
w)=c c>0, c>0 trong đó r và w là các xâu trong (TN)*.
Văn phạm loại 1 (cảm ngữ cảnh): Là văn phạm mà các quy tắc có dạng
r1Ar2 cr1w)=c c>0r2, c>0 trong đó r 1 , r 2 và w là các xâu trong (TN)*, AN và
w)=c c>0A Quy tắc S A cũng thuộc văn phạm loại này
Văn phạm loại 2 (phi ngữ cảnh): Là văn phạm mà các quy tắc có dạng
Định lý 2.1 Nếu G=(N,T,P,S) là văn phạm cảm ngữ cảnh mờ thì G là đệ quy.
Chứng minh: Trớc hết ta chỉ ra rằng đối với một loại văn phạm bất kỳ, cận
trên nhỏ nhất trong (7) có thể đợc lấy trên một tập con của tập hợp tất cả dãy
suy dẫn từ S đến x, đó là tập con của tất cả những dãy suy dẫn không lặp (là
dãy mà trong đó không có ri (i=1 m) xuất hiện hơn một lần)
Giả sử rằng trong dãy suy dẫn
Trang 4vì vậy C có thể bị xóa mà không ảnh hởng đến cận trên nhỏ nhất trong (7).
Nh vậy ta có thể thay thế định nghĩa (7) của G(x) bằng
G(x) = {((S,r1), (r1,r2), ,(rm,x)} (9)
trong đó cận trên nhỏ nhất lấy trên tất cả dãy suy dẫn không lặp từ S vào x
Bây giờ ta chỉ ra rằng đối với những văn phạm cảm ngữ cảnh, tập hợp
cận trên nhỏ nhất đợc lấy trong (9) bị giới hạn vào độ dài l 0 của những dãy suy
dẫn, trong đó l 0 phụ thuộc vào x và số lợng các ký hiệu trong (TN)
Nếu G là văn phạm cảm ngữ cảnh thì vì đặc tính không thu hẹp đợc củacác quy trong P nên nó kéo theo: r j r i nếu j>i (10)
Đặt TN =k Vì có tối đa k’ xâu phân biệt trong (TN)* có độ dài l
và vì dãy suy dẫn là không lặp nên từ (10) ta có tổng độ dài của dãy đợc giớihạn bởi l0= 1+k+ +k x
.Tiếp theo ta đa ra một phơng pháp sinh ra tất cả dãy suy dẫn hữu hạn từ
S đến x có độ dài l0 Ta bắt đầu với S và dùng P sinh ra tập Q1 của tất cả cácxâu trong (TN)* có độ dài x mà có thể sinh từ S trong một bớc Sau đó ta
xây dựng Q2, tập hợp tất cả các chuỗi trong (TN)* có độ dài x mà có thể
sinh từ S trong hai bớc Lu ý, Q2 đồng nhất với tập tất cả các xâu trong(TN)* với độ dài x mà đợc sinh trực tiếp từ các xâu trong Q1 Tiếp tụcvới quá trình này, ta xây dựng liên tiếp Q3, Q4, , Qk cho đến khi k=l0 hoặc
Qk= Vì Qi (i=1 k) là tập hữu hạn, ta có thể tìm trong một số hữu hạn của
các tập tất cả các dãy suy dẫn không lặp từ S đến x với độ dài l0 và vì vậy đểtính toán G(x) bằng sử dụng (9) Sau đó thiết lập một thuật toán để tính toán
G(x) Vì vậy G là đệ quy
3 Văn phạm phi ngữ cảnh mờ
Nhiều kết quả cơ sở trong lý thuyết ngôn ngữ hình thức có thể dễ dàng
đợc mở rộng thành ngôn ngữ mờ Phần này ta đa ra một mở rộng nh vậy trongtrờng hợp những dạng chuẩn tắc của Chomsky và Greibach đối với nhữngngôn ngữ phi ngữ cảnh
Trớc hết, ta xét dạng chuẩn tắc Chomsky đối với ngôn ngữ phi ngữ cảnhmờ
Bất kỳ ngôn ngữ phi ngữ cảnh đợc sinh ra bởi một văn phạm trong đócác quy tắc có dạng A BC hoặc A a, với A,B,C là ký hiệu không kết
thúc và a là ký hiệu kết thúc Dạng này đợc gọi là dạng chuẩn tắc Chomsky.
Cho G là một văn phạm phi ngữ cảnh mờ Văn phạm này tơng đơng vớimột văn phạm G’ trong đó tất cả quy tắc có dạng A c
BC, A c
a, với
c>0 và A,B,C là ký hiệu không kết thúc và a là ký hiệu kết thúc.
Ta xây dựng G’ theo ba giai đoạn:
Thứ nhất, ta xây dựng một văn phạm G1 tơng đơng với G trong đókhông có quy tắc dạng A B, A,BN
Trang 5Giả sử rằng trong G ta có quy tắc dạng A B mà dẫn đến dãy suydẫn dạng: A c1
B1 c2 B2 c3 c m
Bm c m1 B c m2
r với rN,khi đó ta thay thế tất cả các quy tắc dạng:
A c1
B1, B1 c2 B2, , Bm c m1 B trong G bằng các quy tắc đơndạng A c
r trong đó c = (AB) (B,r) (11)
trong đó (AB) = {(A1,B1) (Am,B)} (12)với cận trên nhỏ nhất đợc lấy trên tất cả dãy suy dẫn không lặp từ A đến B.Suy ra văn phạm kết quả G1 tơng đơng với G
Thứ hai, ta xây dựng một văn phạm G2 tơng đơng với G1 trong đó không
B1 B2 Bm, c>0 m>2 Ta thay thế tất cả quy tắc này bởiquy tắc
Trang 6Sau đây ta xét dạng chuẩn tắc Greibach.
Cho G là văn phạm phi ngữ cảnh mờ bất kỳ G tơng đơng với một vănphạm mờ GG trong đó tất cả các quy tắc có dạng A ar, với A là một ký
hiệu không kết thúc, a là một ký hiệu kết thúc và r là một xâu trong N* Văn
phạm mờ GG là trong dạng chuẩn Greibach Để xây dựng GG ta phải sử dụnghai bổ đề dới đây:
Bổ đề 3.2 Cho G là một văn phạm phi ngữ cảnh mờ
Đặt A r1Br2 là một quy tắc trong P, với A,BN, và r1, r2(TN)*
Đặt B w)=c c>01, , B w)=c c>0k là tập tất cả các quy tắc với B thuộc vế trái
(B-production)
Đặt G1 là văn phạm kết quả từ sự thay thế của mỗi quy tắc có dạng A
r1Br2 bởi quy tắc A r1w)=c c>01r2, , A r1w)=c c>0rr2 trong đó
(A, r1w)=c c>0ir2) = (A, r1w)=c c>0r2) (B,w)=c c>0i) i=1 k (15)
Khi đó G1 tơng đơng với G
Bổ đề 3.3 Cho G là một văn phạm phi ngữ cảnh mờ
Đặt A Ari (i=1 k) là những quy tắc trong đó A là ký kiệu bên trái
nhất ở vế phải (A-production)
Đặt A w)=c c>0j, là những quy tắc còn lại, với ri, w)=c c>0j(TN)*, (i,j=1 k) Gọi G2 là văn phạm kết quả từ việc thay thế A Ari trong G bằngcác quy tắc: A w)=c c>0jZ (j=1 m) (16)
Z ri Z riZ (i=1 k) (17)Trong đó:
Trang 7Sau đó, ta sửa những quy tắc dạng Ai Ajs, s(TN)*, thực hiện
nh vậy đối với tất cả quy tắc, ji Điều này đợc thực hiện nh sau:
Giả sử rằng nó đã đợc thực hiện đối với i k, đó là, nếu
là một quy tắc với i k, thì j>i Để mở rộng thành A k+1 -production, giả sử
rằng Ak+1 Ajs là quy tắc bất kỳ với j<k+1 Sử dụng bổ đề 3.2 và phép thế
đối với Aj vế phải của mỗi A j -production, ta thu đợc bởi sự lặp lại phép thế các
với độ thuộc đã cho bởi mệnh đề 3.2 và 3.3
Với (21) và (22), ký hiệu bên trái nhất của vế phải của bất kỳ quy tắc
đối với Am phải là một ký hiệu kết thúc Tơng tự, đối với Am-1, ký hiệu bên tráinhất của vế phải bắt buộc là Am hoặc ký hiệu kết thúc Sử dụng bổ đề 3.2 thaythế đối với Am, ta thu đợc các quy tắc mà vế phải của nó bắt đầu với ký hiệukết thúc Lặp lại quá trình này đối với Am-2, ,A1, các quy tắc Ai (i=1 m), đợc
đặt vào dạng mà vế phải của chúng bắt đầu là các ký hiệu kết thúc
Tại giai đoạn này, chỉ những quy tắc trong (23) có thể không là trongdạng mong muốn Suy ra ký hiệu bên trái nhất trong trong (23) có thể hoặcmột ký hiệu kết thúc hoặc một trong những Ai (i=1 m) Nếu trờng hợp thứ haithỏa mãn, áp dụng bổ đề 3.2 vào mỗi Zi quy tắc sinh ra các quy tắc của dạngmong muốn Điều này hoàn thành việc xây dựng
Cho T={a,b}, N={A1,A2,A3}, và cho các quy tắc là trong dạng chuẩntắc Chomsky
Trang 8Tiếp theo, ta áp dụng bổ đề 3.3 vào quy tắc A1 A3A1A3A2, A3
bA3A2 và A3 a Đa vào Z3 và thay quy tắc A3 A3A1A3A2 bởi A3
A3A1 và sau đó quy tắc với A2 ở bên trái đợc dùng để thay thế A2 trong quy tắc
A1 0.8 A2A3 Kết quả thu đợc nh sau:
Trang 9Bớc 3: Hai quy tắc Z3 0.2 A1A3A2 và Z3 0.2 A1A3A2Z3, đợc biến đổi thànhdạng mong muốn bằng cách thế vế phải của mỗi trong năm quy tắc với A1
nằm bên trái đối với sự xuất hiện đầu tiên của A1 Vì vậy Z3 0.2 A1A3A2
Trang 10Định nghĩa 4.1 Một văn phạm max-product phi ngữ cảnh (CMG) là một bộ
bốn G=(T,N,P,) sao cho thỏa mãn những điều kiện dới đây:
(1)- T và N là những tập rời nhau, hữu hạn và không rỗng
(2)- P là một tập hợp hữu hạn các quy tắc mờ mà mỗi quy tắc có dạng A
Cho G=(T,N,P,) là một CMG Khi đó ta viết xp y(mod w)=c c>0), trong đów)=c c>0=(r1,k1) (r2,k2) (rn,kn), x,y(TN)*, ri=(Ai p i xi)P, kiN (i=1 n) vàp=p1p2 pn nếu và chỉ nếu tồn tại zi(TN)* (i=0 n) sao cho z0=x, zn=y, và
đối với mỗi i =1,2, ,n, zi thu đợc từ z i-1 bằng cách thay thế sự xuất hiện thứ k i
của Ai trong z i-1 bởi x i Cách viết khác: x0 y(mod w)=c c>0)
Nếu đối với mọi i=1,2, ,n, ki=1 và zi-1=uAiv, trong đó uT*, thì ta viết:xp
L y(mod w)=c c>0) Cách viết khác: x0
L y(mod w)=c c>0)
Rõ ràng, p đợc xác định duy nhất bởi x,y(TN)* và w)=c c>0(PN)* Điều
này cho phép ta định nghĩa, đối với mỗi w)=c c>0(PN)*, hàm w)=c c>0 và L
w)=c c>0 từ(TN)*(TN)* vào 0 sao cho w)=c c>0(x,y)=p nếu và chỉ nếu xp y(mod w)=c c>0) và
L
w)=c c>0(x,y)=p nếu và chỉ nếu xp
L y(mod w)=c c>0)Cho G=(T,N,P,) là một CMG Cho W=PN
ngôn ngữ mờ hữu hạn là một hàm từ S* vào 0
Cho G là CMG Khi đó G là ngôn ngữ mờ đợc sinh ra bởi G và L
G làngôn ngữ mờ đợc sinh ra bởi G chỉ sử dụng suy dẫn trái nhất
G
Chứng minh: Đặt G=(T,N,P,) Nó là đủ để chỉ ra rằng đối với tất cả AN,
xT* và p 0, nếu Ap x(mod w)=c c>0) đối với w)=c c>0(PN)* thì Ap
L x(mod w)=c c>0’) đốivới w)=c c>0’(P{1})* Điều này có thể đợc hoàn thành bởi phơng pháp quy nạptrên x
Định nghĩa 4.5 Cho là một ngôn ngữ mờ hữu hạn trên T đợc gọi là một
ngôn ngữ mờ phi ngữ cảnh hữu hạn (CFFL) nếu =G đối với CMG G
Trang 11Mệnh đề 4.6 Cho là một CFFL trên T Khi đó =G đối với CMGG=(T,N,P,) sao cho thỏa mãn các tính chất dới đây:
(1)-Tồn tại A0N sao cho (A0)=1 và (A p
x) P hàm ý A0 khôngxuất hiện trong x
(2) Đối với mọi AN và x(TN)*, (A p1
x) P và (A p2
x) Phàm ý p1=p2 >0
(3)- Đối với mọi AN, tồn tại u,vT* và w)=c c>0(PN)* sao cho
nếu và chỉ nếu đối với mọi AN và w)=c c>0(PN)* thì w)=c c>0(A,A)1
gọn G=(T,N,P,A) trong đó P không chứa bất kỳ quy tắc mờ có dạng A p
CMG thu gọn G=(T,N,P,A0), trong đó P không chứa bất kỳ quy tắc mờ códạng A p
B với A,BN và A p
A với AN\{A0}
những CMG rút gọn G=(T,N,P0,A0), trong đó A p
AP0 hàm ý A=A0 Cho
là hàm từ (TN)*(TN)* vào 0 sao cho đối với mọi s,t(TN)*
(s,t)=
p s otherwise
0(s,t)= 1 s=
otherwise
t P o
Trang 12Đặt ’ Là hàm từ (TN)*(TN)* vào 0 sao cho đối với mọis,t(TN)*
Đối với mọi w)=c c>0(P)+ và >0 tồn tại w)=c c>00(P0)+ sao cho
w)=c c>0(A,x)>w)=c c>00(A,x)- Hơn nữa đối với mọi w)=c c>00(P0)+ tồn tại w)=c c>0(P)+ saocho w)=c c>00(A,x) w)=c c>0(A,x) Nh vậy =G Mệnh đề đảo dới đây xuất phát từ điều
đó G(x)={{(A)w)=c c>0(A,x) | AN} | w)=c c>0(P)*, w x }
Định lý 4.11 (Dạng chuẩn tắc chomsky): là một CFFL hữu hạn nếu và chỉ
nếu =G đối với các CMG rút gọn G=(T,N,P,A0), trong đó P chỉ chứa nhữngquy tắc mờ dạng A0 p A và A p
a và A p
BC với A,B,CN và aT
Định lý 4.12 (Dạng chuẩn tắc Greibach): là một CFFL hữu hạn nếu và chỉ
nếu =G đối với các CMG rút gọn G=(T,N,P,A0), trong đó P chỉ chứa nhữngquy tắc mờ có dạng A0 p A và A p
az với AN và aT và zN* z 2Nói chung, định lý 4.11 và 4.12 không còn đúng nếu không hữu hạn,trừ khi ta mở rộng định nghĩa của những quy tắc mờ gồm A p
Đặt G=(T,N,P,A0) là một CMG Khi đó xL(,r,>) nếu và chỉ nếu tồntại w)=c c>0(P0)* sao cho Ap x(mod w)=c c>0) và p>r
Một văn phạm là một bộ bốn G=(T,N,P,A0) trong đó T là ký hiệu kếtthúc và N là ký hiệu không kết thúc, sao cho TN=, P là một tập hữu hạncác quy tắc, và A0N là ký hiệu bắt đầu Suy dẫn theo G, ngôn ngữ L(G) đợcsinh ra bởi G, và những loại văn phạm khác nhau trong phân cấp Chomsky đ-
ợc định nghĩa trong cách thông thờng
Định lý 5.1 L là một ngôn ngữ phi ngữ cảnh (CFL) nếu và chỉ nếu L=L(,r,>)
đối với những CFFL
G’=(T,N,P’A0) là một văn phạm phi ngữ cảnh, trong đó P’={s t | (s p
t)P và p>0} Khi đó nó kéo theo L=L(G’) Dễ dàng chứng minh đợc chiềungợc lại
:Ta* P(Ta*) Giả sử rằng (A)={A} và (ax)=(a)(x) đối với mọiaT và mọi xT* Thì đợc gọi là một phép thế Nếu LT*, đặt
(L)=xL(x)
Trang 13Định nghĩa 5.3 Một bộ chuyển đổi là một bộ sáu M=(X,Q,Y,H,q0,F) với X,
Q và Y là những tập khác rỗng hữu hạn, H là một tập hữu hạn QX*Y*Q,
q0Q là phát biểu ban đầu, FQ là tập các phát biểu chấp nhận
Cho M=(X,Q,Y,H,q0,F) là một bộ chuyển đổi Đối với mỗi xX*, đặtM(x)={yY* | x1,x2, ,xkX* và y1,y2, ,ykY* và q1,q2, ,qkQ sao chox=x1x2 xk, y=y1y2 yk, qkF và (qi-1,xi,yi,qi)H đối với mọi i =1 k} Đối vớimỗi LX*, đặt M(L)=xLM(x)
Nếu L là một CFL và M là bộ chuyển đổi, thì M(L) là một CFL Nếu L
là một CFL và là một phép thế sao cho (a) là một CFL đối với tất cả a thì
(L) cũng là một CFL
chặt G và r 0
0 Không mất tính tổng quát, ta giả sử N=N1N2, trong đó
L bằng cách bỏ qua tất cả những từ trong L0 không chứa bất kỳ xuất hiện của
A, và sau đó thay thế đúng một xuất hiện của A bởi x trong những từ còn lại
của L0 Đối với tất cả AN1, đặt L(A)=(GA,0,>), với GA=(TN2,N1,P1, A)
Rõ ràng, L(A) là một CFL đối với tất cả AN1 Đặt là một phép thếsao cho (A)=L(A) nếu AN1 và (A)={a} nếu aTN2 Đối với tất cả L1,
L2(TN2)* và kN, định nghĩa L1 L2 nếu và chỉ nếu tồn tại
L0’,L1’, ,Lk’(TN2)* sao cho L1=L0’, L2=Lk’ và Li-1 Li đối vớii=1,2 ,k Định nghĩa L1k L2 nếu và chỉ nếu L3(TN2)* sao cho L1k L3 và
L2=L3T* Rõ ràng nếu L1 là một CFL và L1k L2 đối với k thì L2 cũng là mộtCFL Vì r>0 nên tồn tại n sao cho xL hàm ý xL2 đối với các L2T*,trong đó (A0)k L2 và kn Đặt ={L2 T* | (A0) k L2 đối với k n và
L2L } Suy ra L2 hàm ý L2L Do đó L=L2L2 Vì vậy, L là mộtCFL Dễ dàng chứng minh đợc điều ngợc lại (ĐPCM)
p
x)P hàm ý pc Khi đó L(G,r,>) là hữu hạn đối với tất cả r 0
= G1 đối với CMG G1 mà trong dạng chuẩn tắc Greibach Đặt n là số nguyên
lớn nhất sao cho cn > r Khi đó xL(G1,r,>) hàm ý x n Nh vậy L(G,r,>)=L(G1,r,>) là hữu hạn (ĐPCM)
Chú ý, Định lý 5.4 và định lý 5.5 còn đúng nếu > đợc thay bởi
Định lý 5.6 Cho là một CFFL Khi đó L(,,=) là một CFL.
Trang 14Chứng minh: Đặt =G, trong đó G=(T,N,P,A0) là một CMG Bằng nhận xétsau định lý 4.11 và 4.12, ta có thể giả sử rằng G là trong dạng chuẩn tắcGreibach với điều kiện là ta cho những quy tắc mờ có dạng s p
t, với p=
Đối với tất cả aT, đặt a’ một ký hiệu mới và đặt T’={a’| aT} Đối với tất cả x(TN)* đặt x’(T’N)*, trong đó x’ thu đợc từ x bằng cách thay thế tất cả aT trong x bởi a’ Đặt G=(TT’, N, P0,A0) là văn phạm phi ngữ cảnh, trong
tơng ứng aT trong những từ còn lại Vì G là một dạng chuẩn tắc Greibach
nên xL(,,=) nếu và chỉ nếu x đợc sinh ra từ A bằng cách sử dụng ít nhất
Đặt C là họ của tất cả CFL và R là họ của tất cả ngôn ngữ chính quy
Chứng minh: Đặt LC Khi đó L=L(G) đối với văn phạm phi ngữ cảnh
G=(T,N,P,A0) Đặt p=1+r và G’=(T,N,P’,A0) là một CMG, trong đó P’={A
x | (A x)P} Suy ra L=L(G,r,>) Do đó LLr Vì vậy CLr
(ĐPCM)
r1 0 Theo định lý 5.7 và 5.8, nó là đủ để xem xét trờng hợp với r1>0 ĐặtG=(T,N,P,) trong đó (A)=r/r1 1(A) đối với tất cả AN Rõ ràngL=L(G,r,>) Do đó LLr Vì vậy L Lr Vì Lr L nên L= Lr (ĐPCM)
r0
G=(T,N1,P1,A1) Từ theo định lý 4.11 và 4.12, ta có thể giả sử rằng G trongdạng chuẩn tắc Greibach với điều kiện là ta chấp nhận những quy tắc mờ códạng A p
x, với p= Theo định lý 5.6 L(G,=)=L(G2) đối với ngôn ngữphi ngữ cảnh G2=(T,N2,P2,A2) Giả sử rằng G2 cũng là dạng chuẩn tắcGreibach và N1N2 = Đặt A0TN1N2 Đặt G=(T,N,P,A0) là một CMG,trong đó N=N1N2{A0}, và P gồm tất cả quy tắc mờ có dạng sau:
Rõ ràng, G là trong dạng chuẩn tắc Greibach Vì vậy theo định lý 4.12,
là hữu hạn Suy ra L=L( ,1/2,>) Dễ dàng chứng minh điều ngợc lại
Trang 15Định lý 5.11 C là một họ con riêng biệt của L.
{A0,A1,A2},P,A0) là một CMG trong đó P gồm có những quy tắc mờ A0 1
A1A2, A1 2 aA1b, A1 1 ab, A2 0.5 A2, A2 1 c Suy raL=L(G,b,>) Nh vậy LL
Ta viết sp t nếu sp t(mod w)=c c>0) đối với một số w.
r0, tồn tại nN sao cho mọi từ xL với x >n có dạng s1s2s3s4s5, với s2A
và hoặc s1s2 s3s4 s5L đối với mọi k hoặc s1s3s5L
G=(T,N,P,A0) là một CMG trong dạng chuẩn tắc Greibach Đặt N =m, nếux=s1s2s3s4s5L và x >m, suy ra có một AN sao cho A0p1s1At1
p2s1s2At2t1p3s1s2s3s4s5=x, trong đó siT*, tiN*, s2A, Ap4s3, t2p5s4, t1p6s5,
p4p5p6=p3, và p1p2p3>1 Dễ dàng kiểm tra lại rằng (1) nếu p2p51 thì
s1s2 s3s4 s5L k và (2) nếu p2p5<1 thì s1s3s5L (ĐPCM)
L=L(G,1,>), trong đó G=(T,N,P,A) là một CMG trong dạng chuẩn tắcGreibach Đặt N =m và đặt x= s1s2s3s4s5s6s7 L, trong đó x >m2 Khi đó tồntại AN sao cho:
A0 p1 s1At1 p2 s1s2At2t1 p3 s1s2s3At3t2t1 p4 s1s2s3s4s5s6s7 Với siT*,
tiN*, s2s3e, Ap5s3,t3p6s5, t1p7s7, p5p6p7p8=p4, và p1p2p3p4>1 Từ bổ đề 5.12,
ta thấy rằng không phải p2p71 mà cũng không phải p3p61 Tuy nhiên, nếu
p2p7<1 và p3p6<1 thì theo bổ đề 5.12, s1s2s4s6s7 và s1s3s5s6s7 là thuộc L Điềunày là không thể xảy ra Nh vậy LL (ĐPCM)
cây phạm vi (tree domain) hữu hạn nếu những điều kiện sau đợc thỏa mãn:
(1) w)=c c>0U và w)=c c>0=uv hàm ý uU trong đó u,v,w)=c c>0 *;
(2) w)=c c>0nU và mn hàm ý w)=c c>0mU, trong đó w)=c c>0*, m,n,
Cho U là một cây phạm vi hữu hạn Thì tập con U={w)=c c>0U | w)=c c>0.1U}
đ-ợc gọi là nút lá Một cặp (N,T) của những bảng chữ hữu hạn N và T, trong đó
NT= đợc gọi là một bảng chữ đợc săp xếp từng phần Một cây t trên một
bảng chữ đợc sắp xếp từng phần (N;T) là một hàm từ một phạm vi cây hữuhạn U vào NT, đợc viết t: U (N;T), sao cho:
t(w)=c c>0)N đối với w)=c c>0U\U
t(w)=c c>0)T đối với w)=c c>0U
Tất nhiên, một cây hữu hạn t: U (N;T), có thể đợc biểu diễn bởimột tập hữu hạn các cặp (w)=c c>0,t(w)=c c>0)), nghĩa là {(w)=c c>0,t(w)=c c>0)) | w)=c c>0U}
Trang 16Những cây trên (N;T) có thể đợc biểu diễn bằng đồ thị bằng cách xâydựng một cây gốc (trong đó mỗi nút kế tiếp đợc đánh số thứ tự) biểu diễnphạm vi của ánh xạ, và nhãn của những nút với những phần tử của NT biểudiễn giá trị của hàm Trong hình dới đây có hai ví dụ, một ánh xạ, cây bên trái
có miền U={, 1,2,11,12} và giá trị tại 11 là a Cũng chú ý rằng U
(N;T) của giả số hạng trên NT nh tập con nhỏ nhất của[NT{(,)}]* thỏa mãn những điều kiện dới đây:
Ta xét những cây và giả số hạng là sự hình thức hóa tơng đơng Với ví
dụ trên, các cây tơng ứng với giả số hạng dới đây:
A(B(a b)a), f(g(f(ab) g(ab) f(ab))
Sự tơng đơng này có thể đợc thực hiện nh dới đây:
Ta biểu thị tập các cây trên (N;T) bằng DP
(N;T), các phần tử của nó bởi t,
và các giả số hạng tơng ứng với một cây t bởi p(t) hoặc tP
Một tập T mờ của các cây đợc định nghĩa bởi một hàm thuộc T: DP
(N;T)
[0,1] Tập tất cả các tập mờ của các cây đợc biểu thị bởi F(DP
(N;T))
7 Những hệ thống sinh ngôn ngữ mờ
Định nghĩa 7.1 Một hệ thống sinh ngôn ngữ phi ngữ cảnh mờ (F-CFDS) là bộ
năm S=(N0,N,T,P,0) sao cho những điều kiện dới đây đợc thỏa mãn:
(1)- N0 là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu nút không kết thúc
(2)- N là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu nút
(3)- T là một tập hữu hạn các ký hiệu mà phần tử của nó đợc gọi là kýhiệu lá
B1
11a
111 112
g12
121 122
f2
21 b22