Nếu như để trả lời cho câu hỏi khi nào một phương trình đa thức giải được bằng căn thức hay khi nào một hình có thể dựng được bằng thước kẻ và compa, người ta cần đến lý thuyết mới đó là
Trang 1BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
- -
NGUYỄN THU THẢO
TÌM HIỂU VỀ BÀI TOÁN THỨ MƯỜI
CỦA HILBERT
LUẬN VĂN TỐT NGHIỆP
HÀ NỘI - 2011
Trang 2BỘ GIÁO DỤC VÀ ĐÀO TẠO TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI
- -
NGUYỄN THU THẢO
TÌM HIỂU VỀ BÀI TOÁN THỨ MƯỜI
CỦA HILBERT
Chuyên ngành : Đại số và lý thuyết số
LUẬN VĂN TỐT NGHIỆP
Người hướng dẫn khoa học:
PGS.TS DƯƠNG QUỐC VIỆT
HÀ NỘI - 2011
Trang 3Mục lục
Lời mở đầu……… 2
Chương 1 Sơ bộ về ngôn ngữ hình thức, văn phạm và ôtômát ………… 4
1.1 Vị nhóm, vị nhóm tự do……… 4
1.2 Ngôn ngữ hình thức……… 6
1.3 Văn phạm và ngôn ngữ sinh bởi văn phạm……… 15
1.4 Ôtômát hữu hạn……… 28
Chương 2 Máy Turing và hàm đệ quy……… 32
1.1 Máy Turing……… 32
1.2 Hàm đệ quy……… ….37
1.3 Các tập hợp và các tân từ đệ quy, đệ quy kể được……… 41
1.4 Các tính chất của tập đệ quy, đệ quy kể được……… 46
1.5 Đánh số Gödel các máy Turing……… 49
1.6 Luận đề Turing – Church……… 51
1.7 Các kết quả không quyết định được cơ bản……… 52
1.8 Khả năng rút gọn……… 57
Chương 3 Bài toán thứ mười của Hilbert ……… ………… 60
3.1 Bài toán quyết định và vấn đề giải được……… 60
3.2 Bài toán tương ứng Post……… 63
3.3 Bài toán thứ mười của Hilber và hệ quả……… … 70
Kết luận……… 78
Tài liệu tham khảo……… 79
Trang 4Lời mở đầu
Trong Toán học nói chung và trong lĩnh vực Đại số, số học nói riêng, từ cổ xưa con người đã gặp rất nhiều bài toán khó, trong đó có lớp bài toán Điôphăng về giải phương trình nguyên Mỗi một bài toán thuộc lớp này là một bài toán khó Câu hỏi đặt ra là giải các bài toán này như thế nào Người ta luôn nghĩ rằng đã đưa ra bài toán là có thể giải được Gần đây, có những nhà toán học luôn nghi ngờ mọi sự kiện hiển nhiên, trong đó có một đại diện là Hilbert Ông đặt ra câu hỏi là liệu có thể tìm được một thuật toán giúp ta xác định sau một số hữu hạn bước, một phương trình Điôphăng bất kỳ có nghiệm nguyên hay không Đó cũng là nội dung bài toán thứ mười trong số 23 bài toán được ông nêu ra tại Đại hội toán học thế giới năm 1900 Câu trả lời đã được nhà toán học Matijasevitch đưa ra năm 1970 là không có thuật toán như vậy
Nếu như để trả lời cho câu hỏi khi nào một phương trình đa thức giải được bằng căn thức hay khi nào một hình có thể dựng được bằng thước kẻ và compa, người ta cần đến lý thuyết mới đó là lý thuyết Galois, thì vấn đề một bài toán có quyết định (giải) được hay không đòi hỏi phải sử dụng đến các công cụ để hiểu sâu về bản chất tư duy tính toán của con người về các hàm số học và thuật toán mà đối tượng cần nghiên cứu để dẫn đến kết quả của Matijasevitch là các hàm đệ quy, các hàm số học tính được, tập và quan hệ đệ quy và khái niệm thuật toán theo nghĩa của mô hình máy Turing
Luận văn này được hoàn thành với mục đích tìm hiểu các khái niệm này, trình bày các kết quả có liên quan đưa đến kết quả về tính không giải được của bài toán thứ mười của Hilbert Với mục tiêu như vậy luận văn được chia thành các chương với nội dung như sau:
Trang 5Chương 1 Sơ bộ về ngôn ngữ hình thức, văn phạm và ôtômát Trong chương này tác giả trình bày các kiến thức cơ bản về ngôn ngữ hình thức, văn phạm và ôtômát
Chương 2 Máy Turing và hàm đệ quy Chương này tác giả tập trung trình bày các đối tượng để dẫn đến kết quả của Matijasevitch đó là các hàm đệ quy, các hàm số học tính được, tập và quan hệ đệ quy và khái niệm thuật toán theo nghĩa của mô hình máy Turing Sau đó đi đến luận đề Turing-Church cho phép đồng nhất khái niệm trực giác về thuật toán với khái niệm chính xác toán học (máy Turing) Cuối cùng tác giả trình bày một số kết quả không quyết định được cơ bản và khả năng rút gọn của các tập
Chương 3 Bài toán thứ mười của Hilbert Từ các kết quả của chương 2, tác giả sẽ trình bày đến tính không giải được của bài toán thứ mười của Hilbert, cũng như một số bài toán không giải được khác
Mặc dù bản thân đã có nhiều cố gắng nhưng do điều kiện thời gian ngắn, trình độ và kinh nghiệm nghiên cứu khoa học còn hạn chế, nên luận văn chắc chắn không tránh khỏi những thiếu sót Tác giả rất mong nhận được những đóng góp của các thầy cô và các bạn đồng nghiệp để tác giả có thể tiếp tục nghiên cứu tốt hơn
Luận văn được thực hiện và hoàn thành dưới sự hướng dẫn của PGS.TS Phan Trung Huy Nhân dịp này em xin bày tỏ lòng biết ơn sâu sắc và kính trọng tới thầy đã tận tình giúp đỡ để em hoàn thành luận văn này
Cuối cùng tác giả xin chân thành cảm ơn các thầy cô trong tổ Đại số, Ban chủ nhiệm khoa Toán-Tin, phòng quản lý nghiên cứu khoa học của trường Đại học sư phạm Hà nội đã tạo điều kiện thuận lợi để tác giả hoàn thành công việc học tập và nghiên cứu của mình
Hà nội, tháng 11 năm 2011
Tác giả
Trang 6Định nghĩa 1.1.3 Tập Σ khác rỗng gồm hũu hạn hay vô hạn các ký hiệu
được gọi là bảng chữ cái Mỗi phần tử a Σ được gọi là một chữ cái hay một
Trang 7bảng chữ cái Σ Xâu rỗng là từ đặc biệt không có chữ cái nào, ký hiệu là
Tổng số vị trí của các ký hiệu xuất hiện trong xâu α được gọi là độ dài của xâu α và kí hiệu là
Hai từ α = a 1 a 2 …a n và β = b 1 b 2 …b m được gọi là bằng nhau, và được ký
hiệu là α = β, nếu n = m và a i = b i với mọi i = 1, 2, …, n
Phép toán nhân ghép (.) là phép toán thỏa mãn: ωε = εω = ω và α =
a 1 a 2 …a m , β = b 1 b 2 …b n thì γ = α.β = a 1 a 2 …a m b 1 b 2 …b n với mọi
, ,
Tập mọi từ trên bảng chữ cái Σ được kí hiệu là *
Tập mọi từ khác rỗng trên bảng chữ cái Σ được ký hiệu là
Nhận xét 1.1.5 Dễ thấy cùng với phép nhân ghép (.) làm thành một nửa nhóm, còn *cùng với phép nhân ghép (.) làm thành một vị nhóm với đơn vị là
Mệnh đề 1.1.8 Nếu Σ là bảng chữ cái thì Σ * là tập (vô hạn) đếm được
Chứng minh Do mỗi số tự nhiên n đều tồn tại một từ trên Σ có độ dài n nên Σ*
là một tập vô hạn Giả sử Σ={a1, a2, …, an} Xét ánh xạ f từ Σ* vào tập hợp N các số tự nhiên xác định bởi:
f(ε) = 0, f(ai) = i, f(αai) = (n+1)f(α)+i, αΣ*
Trang 8trong đó 2 vế là hai khai triển của một số nguyên theo cơ số n+1 Do đó, k=h
và iu=ju với 1 ≤ u ≤ k hay α=β Vì vậy, f là một đơn ánh Từ đó suy ra Σ* là một tập đếm được
Ngôn ngữ rỗng: L = khác với ngôn ngữ chỉ gồm một từ rỗng: L = {ε}
Ví dụ 1.2.2
1 * là ngôn ngữ gồm tất cả các từ trên Σ còn là ngôn ngữ gồm tất cả các từ khác từ trống trên Σ
Trang 92 L = { ε, 0, 1, 01, 10, 00, 11, 011,100} là một ngôn ngữ trên bảng chữ cái Г = {0, 1}
3 L = {a, b, c, aa, ab, ac, abc } là ngôn ngữ trên bảng chữ cái Σ = {a, b, c}
4 L1 = {ε, a, b, abb, aab, aaa, bbb, abab}, L 2 = {a n b n | n N} là hai ngôn
ngữ trên bảng chữ Σ = {a, b}, L1 là ngôn ngữ hữu hạn trong khi L2 là ngôn ngữ vô hạn Mỗi từ thuộc ngôn ngữ L2 có số chữ cái a bằng số chữ cái b với a và b không xen kẽ, a nằm ở phía trái và b ở phía phải của từ 1.2.2 Các phép toán trên các từ
Các phép toán sau đây thực hiện trên các từ trên cùng một bảng chữ cái Σ, tạo nên các từ mới cũng thuộc cùng một bảng chữ cái
1.2.2.1 Phép nhân ghép
Định nghĩa 1.2.2.1 Tích ghép (hay nhân ghép) của hai từ α = a1a2…am và từ
β = b1b2…bn trên bảng chữ cái Σ, là từ γ = a1a2…amb1b2…bn trên bảng chữ cái
Σ
Kí hiệu phép nhân ghép là γ = α.β (hay γ = αβ)
Nhận xét 1.2.2.2 Từ định nghĩa trên, ta thấy:
Từ rỗng là phần tử đơn vị đối với phép nhân ghép, tức là: ωε = εω = ω đúng với mọi từ ω
Phép nhân ghép có tính kết hợp, nghĩa là với mọi từ α, β, γ, ta có (αβ)γ
Trang 10của lôgarit: với mọi từ α, β và mọi số tự nhiên n, thì:
, và
n n
Với phần tử đơn vị, tức là từ rỗng ε, thì = 0
1.2.2.2 Phép lấy từ ngược
Định nghĩa 1.2.2.3 Giả sử có từ khác rỗng ω = a1a2 …am trên bảng chữ cái
Σ, khi đó từ a m a m-1 … a 2 a 1 được gọi là từ ngược (hay từ soi gương) của từ ω,
và được kí hiệu là r, hay ^
Khi ω = ε ta quy ước r
Tính chất 1.2.2.4 Từ định nghĩa trên dễ thấy rằng phép lấy từ ngược có các tính chất sau:
β r = bbaa và (β r ) r = (bbaa) r = aabb = β
2 Cho các từ happy và oto trên bảng chữ cái = {a, b, c, …x, y, z}, khi đó
ta có:
(happy)r = yppah và (oto)r = oto
Ngoài ra ta có: happyr = yppah = happy = 3
1.2.2.3 Phép cắt từ
Cho u, v là hai từ thuộc bảng chữ cái *
Trang 11Định nghĩa 1.2.2.6 Phép cắt trái của từ v cho từ u cho kết quả là phần còn lại của từ v sau khi ngắt bỏ phần đầu u trong từ v, và được ký hiệu là u v1
1
u v
nếu u v
không xác định nếu không tồn tại : u v
Định nghĩa 1.2.2.7 Phép cắt phải của từ v cho từ u cho kết quả là phần còn lại của từ v sau khi ngắt bỏ phần cuối u trong từ v, và được ký hiệu là vu1
1
vu
nếu u v
không xác định nếu không tồn tại : u v
Ví dụ 1.2.2.8 Cho bảng chữ cái ∑ = {a, b, c}, khi đó ta có:
1 Với từ u * tùy ý thì u u1 uu1
2 Với ua v, aba thì u v1 ba vu, 1 ab
3 Với ua v, b thì u v1 và uv1 không xác định
1.2.3 Các phép toán trên ngôn ngữ
Do mỗi ngôn ngữ là một tập hợp nên ta có các phép toán đại số tập hợp như
là phép giao, phép hợp, phép hiệu, phép lấy bù trên các ngôn ngữ Chẳng hạn, với L1 và L2 là hai ngôn ngữ trên bảng chữ cái Σ thì ta cũng có các ngôn ngữ mới sau đây trên bảng chữ cái Σ: L1L2, L1 ∩ L2, L1.L2, *\ L1
1.2.3.1 Phép hợp
Định nghĩa 1.2.3.1 Hợp của hai ngôn ngữ L1 và L2 trên bảng chữ cái , ký hiệu L1L2, là một ngôn ngữ trên bảng chũ cái , đó là tập từ:
L = {ω Σ* | ω L 1 hoặc ω L 2 }
Định nghĩa phép hợp có thể mở rộng cho một số hữu hạn các ngôn ngữ, tức là
hợp của các ngôn ngữ L 1 , L 2 , …, L n trên bảng chữ cái Σ, là tập từ:
n i L
= {ω Σ* | ω L i , với i nào đó, 1 ≤ i ≤ n }
Trang 12Tính chất 1.2.3.2 Dễ thấy rằng phép hợp các ngôn ngữ có các tính chất sau:
Tính giao hoán: L1L2 L2L1
Tính kết hợp: (L1L2)L3 L1(L2L3)
Với mọi ngôn ngữ L trên Σ thì: L LL và L * *
1.2.3.2 Phép giao
Định nghĩa 1.2.3.3 Giao của hai ngôn ngữ L1 và L2 trên bảng chữ cái , ký
hiệu L 1 ∩ L 2 , là một ngôn ngữ trên bảng chữ cái , đó là tập từ:
L = {ω Σ* | ω L 1 và ω L 2 }
Định nghĩa phép giao có thể mở rộng cho một số hữu hạn các ngôn ngữ, tức
là giao của các ngôn ngữ L1, L2, …, Ln trên bảng chữ cái Σ, là tập từ:
1
n i i
Định nghĩa 1.2.3.5 Ngôn ngữ phần bù của ngôn ngữ L trên bảng chữ cái Σ,
ký hiệu CΣL (hay CL, nếu không gây nhầm lẫn), là một ngôn ngữ trên bảng chữ cái Σ , đó là tập từ:
CΣL = {ω Σ* | ω ∉ L }
Trang 13Tính chất 1.2.3.6 Dễ thấy rằng phép lấy phần bù các ngôn ngữ có các tính chất sau:
Trang 14có tính phân phối đối với phép nhân ghép, tức là với mọi ngôn ngữ L1,
Vậy L1(L2 ∩ L3) ≠ (L1L2) ∩ (L1L3)), tức là phép nhân ghép không có tính phân phối đối với phép giao
2 Ta có: L2L3 = {010, 100}, do đó:
L1 (L2L3) = {0, 01, 010, 100},
Mặt khác ta cũng có L1 L2 = {0, 01, 10} và L1 L3 = {0, 01}, do đó: (L1 L2)(L1L3) = {00, 001, 010, 0101, 100, 1001}
Vậy L1 (L2L3) ≠ (L1L2)(L1 L3), tức là phép hợp không có tính phân phối đối với phép nhân ghép
Trang 15phối đối với phép nhân ghép
Do phép ghép ngôn ngữ có tính kết hợp nên kí hiệu L n được dùng với mọi ngôn ngữ L và số tự nhiên n theo nghĩa quen thuộc sau:
khi n=0 khi n=1
Trang 16L1 = {a2n | n ≥ 1},
L2 = {a5n+3 | n ≥ 0}
Khi đó, ta có L1 = {a2}+, L2 = {a5}*{a3}
1.2.3.6 Phép lấy ngôn ngữ ngược
Định nghĩa 1.2.3.13 Cho ngôn ngữ L trên bảng chữ cái Σ, khi đó ngôn ngữ ngược của L là một ngôn ngữ trên bảng chữ cái , được kí hiệu là L r hay L^,
Ví dụ 1.2.3.15 Cho L = {ε, ab, abc, cbaa} là một ngôn ngữ trên bảng chữ cái
Σ = {a, b, c}, khi đó L r = {ε, ba, cba, aabc} là ngôn ngữ ngược của L
XY , là tập từ:
Trang 17+ Σ là một bảng chữ cái hữu hạn, gọi là bảng chữ cái kết thúc, mỗi phần tử của
nó được gọi là một chữ cái kết thúc
+ Δ là một bảng chữ cái hữu hạn, Δ ∩ Σ = ∅, gọi là bảng chữ cái không kết thúc, mỗi phần tử của nó được gọi là một chữ cái không kết thúc
+ S Δ được gọi là chữ xuất phát
Trang 183 G3 = <{a, b, c}, {S, A, B, C}, S, {S→ABC, A→aA, B→bB, C→cC, A→a, B→b, C→c}>
1.3.2 Ngôn ngữ sinh bởi văn phạm
Cho văn phạm G = < Σ, Δ, S, P > và η, ω V* Ta nói ω được sản sinh
từ η trong G, kí hiệu η*ω nếu η = ω hoặc tồn tại một dãy D = ω0,
ω1,…, ωkV* sao cho ω0 = η, ω k = ω và ωi-1 ωi, với i = 1, 2, , k
Dãy D = ω0, ω1, …, ωk được gọi là một dẫn xuất của ω từ η trong G và số k được gọi là độ dài của dẫn xuất này Nếu ω0 = S và ωk Σ* thì dãy D gọi là dẫn xuất đầy đủ
Cho văn phạm G = < Σ, Δ, S, P > Từ ωΣ* được gọi là sinh bởi văn phạm G nếu tồn tại suy dẫn S* ω Ngôn ngữ sinh bởi văn phạm G,
kí hiệu L(G), là tập hợp tất cả các từ sinh bởi văn phạm G:
L(G) = {ωΣ* | S* ω}
Hai văn phạm G1 = < Σ1, Δ1, S1, P1 > và G2 = < Σ2, Δ2, S2, P2 > được gọi
là tương đương nếu L(G1) = L(G2)
Ví dụ 1.3.4
1 Xét văn phạm G1 trong ví dụ 1.3.1.2 Từ ω = 00001111 được suy
dẫn từ S bằng dăy dẫn xuất độ dài 5:
S 0S1 00S11 000S111 0000S1111 00001111 (có thể viết ngắn gọn là ω = 0414)
Bằng việc sử dụng n lần (n ≥ 0) quy tắc sản xuất 1 rồi quy tắc sản xuất 2, ta
Trang 19có: S * 0n1n Do đó L(G1) = {0n1n | n ≥ 0}
2 Xét văn phạm G2 trong ví dụ 1.3.1.2 Sử dụng quy tắc sản xuất 1, rồi
n lần (n ≥ 0) quy tắc sản xuất 2, sau đó quy tắc sản xuất 3 để kết thúc, ta có: S Aban *
Abnb anbn+1
Do đó L(G2) = {anbn+1 | n ≥ 0}
3 Xét văn phạm G3 trong ví dụ 1.3.1.2 Sử dụng quy tắc sản xuất 1,
rồi m 1 lần (m ≥ 1) quy tắc sản xuất 2, n-1 lần (n ≥ 1) quy tắc sản xuất 3, k 1 lần (k ≥ 1) quy tắc sản xuất 4 (các quy tắc có thể xen kẽ), sau đó kết thúc bởi các quy tắc sản xuất 5, 6, 7, ta có: S ABC*amAbnBckC * ambnck
S Si1 Si2i1 … Sik-1…i2i1 Sikik-1…i2i1, (với i1, i2, …, ik ) trong đó, i1, i2, …, ik-1 ≥ 0 và ik ≥ 1 Do đó, L(G3) = {n | n ≥ 1}
Lập luận như trên, ta nhận được L(G4) = {n | n ≥ 0} Do đó G3 và G4 không tương đương với nhau
2 Xét văn phạm G xác định bởi các sản xuất:
Trang 20S aSA, SaB, BAbBc, cAAc, Bbc
Ta có: L G( )a b c n n n n 1 (1)
Thật vậy, bất kì một dẫn xuất theo G nào đều bắt đầu với một áp dụng sản xuất thứ nhất hoặc thứ hai, sản xuất thứ nhất cho ngay từ kết thúc abc Xét một dẫn xuất bất kì D từ một từ có dạng a Ab c i , mà nó dẫn đến một từ trên bộ i i i, 1chữ cái kết thúc D cần phải bắt đầu với i áp dụng sản xuất thứ ba (A đi sang phải) và sau đó tiếp tục với một sản xuất thứ tư (một xuất hiện nữa của b và c đặt vào) Hiện ta đã dẫn ra từ a b Bbc i i i1 Đối với từ này khả năng duy nhất là phải áp dụng sản xuất thứ năm i lần (B đi sang bên trái), sau đó ta có từ
Tương tự ta cũng có L G( 1)a b c n n n n 1 Do đó hai văn phạm G và G1 là tương đương
1.3.3 Phân loại văn phạm
Dựa vào đặc điểm của tập quy tắc mà người ta chia các văn phạm thành các nhóm khác nhau
Loại kiểu 0: Văn phạm không hạn chế hay văn phạm tổng quát
Loại kiểu 1: Văn phạm cảm ngữ cảnh
Loại kiểu 2: Văn phạm phi ngữ cảnh
Trang 21 Loại kiểu 3: Văn phạm chính quy
Định nghĩa 1.3.9 Văn phạm G = < Σ, Δ, S, P > mà không có một ràng buộc nào đối với các quy tắc của nó được gọi là văn phạm tổng quát hay văn phạm kiểu 0
Như vậy, các quy tắc trong văn phạm loại 0 có dạng: α→β, với α = α’Aα’’,
A Δ, α’, α’’, β (Σ Δ)* Các quy tắc của văn phạm loại 0 được gọi là quy tắc không hạn chế
Định nghĩa 1.3.10 Văn phạm G = < Σ, Δ, S, P > mà các quy tắc của nó đều
có dạng: α→β, với α = α’Aα’’, A Δ, α’, α’’, β (Σ Δ)*, và ≤ , được gọi là văn phạm kiểu 1 hay văn phạm cảm ngữ cảnh
Các quy tắc trong văn phạm loại 1 được gọi là quy tắc cảm ngữ cảnh Các văn phạm mà các quy tắc của chúng có dạng trên, đồng thời chứa thêm quy tắc rỗng S→ε, cũng được xếp vào lớp văn phạm kiểu 1
Ví dụ 1.3.11 Cho văn phạm G = <{a, b, c}, {S, A, B, C}, S, P>, trong đó:
P = {S→aSAC, S→abC, CA→BA, BA→BC, BC→AC, bA→bb, C→c} Khi đó G là văn phạm cảm ngữ cảnh
Sử dụng n-1 lần (n ≥ 1) quy tắc 1, rồi quy tắc 2, kế đến sử dụng liên tiếp các quy tắc 3, 4, 5 (để đổi chỗ A và C), sau đó sử dụng n-1 lần quy tắc 6 và n lần quy tắc 7, ta có:
Trang 22Như vậy, các quy tắc trong văn phạm phi ngữ cảnh có vế trái chỉ chứa một chữ không kết thúc duy nhất còn vế phải là tùy ý, và được gọi là quy tắc phi ngữ cảnh
Ví dụ 1.3.13
1 Cho văn phạm G1 = <{a, b}, {S, A}, S, P>, trong đó:
P = {S→Sa, S→Aa, A→aAb, A→ab}
3 Cho văn phạm G3 = <{a, b}, {S}, S, P3>, với
P3 = {S→ε, S→aSa,S→bSb,S→aa, S→bb}
G3 là văn phạm phi ngữ cảnh và nó sinh ra ngôn ngữ phi ngữ cảnh L(G3) = {ωωr ω {a, b}*} có các từ có độ dài chẵn và có các chữ cái đối xứng nhau từ hai đầu của từ Chẳng hạn các từ abba, bbaabb, ababbaba… là thuộc L(G3)
Định nghĩa 1.3.14 Văn phạm G = < Σ, Δ, S, P > mà các quy tắc của nó chỉ
có dạng A→aB, A→a (hoặc chỉ có dạng A→Ba, A→a ), trong đó A, BΔ,
aΣ, được gọi là văn phạm loại 3 hay văn phạm chính quy
Các văn phạm mà các quy tắc của chúng có dạng trên, đồng thời chứa thêm quy tắc rỗng S→ε cũng được gọi là văn phạm chính quy
Trang 23Các quy tắc trong văn phạm chính quy được gọi là quy tắc chính quy
S 1A 11B 111A … * 1(12n-2)A 1(12n-2)1 = 12n
2 Cho văn phạm G2 = <{0, 1}, {S, A}, S, P2 >,
P2 = {S→0A, A→0A, A→1A, A→0}
Khi đó, G2 là văn phạm chính quy và L(G2) = {0ω0 | ω{0, 1}*} Thật vậy, sử dụng quy tắc 1, rồi một số hữu hạn lần tuỳ ý, có thể xen kẽ các quy tắc 2 và 3, cuối cùng là quy tắc 4, ta có: S 0A * 0ωA 0ω0 1.3.4 Phân bậc ngôn ngữ Chomsky
Ngôn ngữ kiểu 0: Ngôn ngữ sinh bởi văn phạm kiểu 0 gọi là ngôn ngữ loại 0 hay ngôn ngữ đệ qui kể được Ngôn ngữ thuộc kiểu 0 khi và chỉ khi
nó đoán nhận được bởi máy Turing
Ngôn ngữ kiểu 1: Ngôn ngữ sinh bởi văn phạm kiểu 1 gọi là ngôn ngữ kiểu 1 hay ngôn ngữ cảm ngữ cảnh Ngôn ngữ thuộc kiểu 1 thì nó đoán
nhận được bởi máy Turing luôn dừng, tức là bài toán thành viên cho nó là
giải được Nói chung thuật toán giải bài toán thành viên có cỡ lũy thừa
Ngôn ngữ kiểu 2: Ngôn ngữ sinh bởi văn phạm kiểu 2 gọi là ngôn ngữ kiểu 2 hay ngôn ngữ phi ngữ cảnh Ngôn ngữ thuộc kiểu 2 có thuật toán giải bài toán thành viên cỡ đa thức bậc ba
Trang 24 Ngôn ngữ kiểu 3: Ngôn ngữ sinh bởi văn phạm loại 3 gọi là ngôn ngữ kiểu 3 hay ngôn ngữ chính quy Ngôn ngữ thuộc kiểu 3 có thuật toán giải
bài toán thành viên cỡ đa thức bậc một (tuyến tính) (theo 5 )
Nhận xét 1.3.16 Từ các định nghĩa trên, ta thấy lớp văn phạm tổng quát là rộng nhất, nó chứa đựng các văn phạm cảm ngữ cảnh, lớp văn phạm cảm ngữ cảnh chứa các văn phạm phi ngữ cảnh và lớp văn phạm phi ngữ cảnh chứa các văn phạm chính quy
Ngôn ngữ hình thức được gọi là ngôn ngữ đệ qui kể được (hay cảm ngữ cảnh, phi ngữ cảnh, chính quy) nếu tồn tại văn phạm loại tương ứng sinh ra nó
Vì vậy, đối với các lớp ngôn ngữ, nếu kí hiệu L0, L1, L2, L3 lần lượt là các lớp ngôn ngữ đệ qui kể được, cảm ngữ cảnh, phi ngữ cảnh và chính quy thì ta
có bao hàm thức:
L3 L2 L1 L0 Hình vẽ dưới đây cho một sự so sánh về độ lớn của các lớp ngôn ngữ theo phân loại của Chomsky, cho thấy lớp ngôn ngữ chính quy L3 là nhỏ nhất, nó bị chứa thực sự trong lớp ngôn ngữ phi ngữ cảnh L2, lớp ngôn ngữ phi ngữ cảnh lại bị chứa thực sự trong lớp ngôn ngữ cảm ngữ cảnh L1và cuối cùng lớp ngôn ngữ tổng quát L0 (ngôn ngữ ngữ cấu) là rộng nhất
L0
L1
L1
L2 L3 L2
Trang 251.3.5 Tính chất của các lớp ngôn ngữ
Sau đây ta xét ba kết quả thông dụng về " dạng chuẩn" Các kết quả này chỉ ra rằng mỗi ngôn ngữ thuộc một loại nào đó (đệ qui kể được, phi ngữ cảnh, chính qui) có thể được sinh bởi một văn phạm đơn giản hơn văn phạm tổng quát thuộc loại đó
Định lý 1.3.17 Mỗi ngôn ngữ chính quy được sinh bởi một văn phạm sao cho
mỗi sản xuất có dạng AaB hay A, trong đó A và B là các chữ cái không kết thúc và a là chữ kết thúc Hơn nữa, với mỗi cặp (A,a), có đúng một sản xuất AaB trong văn phạm
Chứng minh Giả sử rằng L = L(G), trong đó G = < Σ, Δ, S, P > là một văn
phạm chính quy Ta sẽ xây dựng một văn phạm G1 tương đương với G sao cho mọi sản xuất của G1 thuộc hai dạng hợp lệ được nêu trong phát biểu của định lý 1.3.17 Thêm vào đó, ban đầu G có thể chứa các sản xuất có dạng sau:
1 1
, 2, , , (1) , 1, , (2), , (3)
Như vậy ta cần loại mọi sản xuất trong (1) – (3) khỏi G
Với mỗi sản xuất trong (1) ta đưa vào các chữ không kết thúc mới B1, B k1
và thay (1) bởi các sản xuất
Aa B B1 1, 1a B2 2, ,B k1a B k
Với mỗi sản xuất trong (2) ta đưa vào các chữ không kết thúc mới A1, A và k
thay (2) bởi các sản xuất
Aa A A1 1, 1a A2 2, ,A k1a A A k k, k
Thủ tục này được lặp lại với mỗi sản xuất trong (1) và (2) (Điều quan trọng là các chữ không kết thúc thêm vào luôn là các chữ mới: không có chữ không kết thúc nào được dùng cho hai sản xuất khác nhau) Ta thấy ngôn ngữ L(G) không
Trang 26bị ảnh hưởng bởi các thay thế này Đồng thời các dạng " xấu" của (1) và (2) bị loại Ta còn phải loại các sản xuất (3) mà không tạo ra các sản xuất " xấu" mới
Ta tiến hành như sau: Giả sử A là một chữ không kết thúc bất kỳ (Ta đang xét họ mọi chữ không kết thúc trong văn phạm sau khi loại trừ các sản xuất (1)
và (2)) Ta định nghĩa các tập chữ không kết thúc sau:
Như vậy ta đã cho một phương pháp để xác định, với mỗi A không kết thúc, tập
N(A) gồm mọi chữ không kết thúc B với tính chất A* B
Bây giờ ta loại bỏ mọi sản xuất (3) khỏi văn phạm Với mỗi sản xuất
AaB, ta thêm vào văn phạm mọi sản xuất AaC mà CN B( ) Hơn
nữa ta thêm vào văn phạm chữ xuất phát mới S và mỗi sản xuất S aC sao cho trước khi bỏ các sản xuất (3), văn phạm của ta đã có các sản xuất S'aB,
đã được cài đặt trong các sản xuất đối với ký hiệu xuất phát mới S
Trang 27Như vậy ta đã loại bỏ mọi sản xuất trong (1) - (3) Để hoàn thành chứng minh ta còn phải sửa văn phạm để thỏa mãn điều kiện duy nhất
Bộ chữ cái kết thúc giữ nguyên không đổi, còn các chữ cái không kết thúc mới sẽ là các tập con của tập các không kết thúc trước đây của ta kể cả tập con
trống Nếu các chữ không kết thúc trước đây là S , A và B thì bây giờ chúng là
, S , B ,S A, , S B, ,A B, ,S A B, ,
Các ngoặc vuông được dùng để chỉ rằng các tập con được xem như là một chữ Nói chung nếu đã có n chữ cái không kết thúc trong văn phạm trước thì sẽ có
2n chữ không kết thúc trong văn phạm mới
Chữ xuất phát mới là tập con S chỉ gồm một mình chữ xuất phát cũ Các sản xuất được định nghĩa như sau:
(i) Với một tập con X các chữ không kết thúc, sản xuất X thuộc văn phạm mới nếu có một chữ không kết thúc A trong X sao cho sản xuất
A thuộc văn phạm trước đây (Như vậy sản xuất không bao giờ có trong văn phạm mới)
(ii) Với một tập con X các ký hiệu không kết thúc và một chữ kết thúc a, sản
xuất X a Y thuộc văn phạm mới, trong đó Y là tập con duy nhất các chữ không kết thúc được xác định bởi:
Y B với a nào đó thuộc X, sản xuất AaB thuộc văn phạm trước
Như vậy với mọi a, a là một sản xuất trong văn phạm mới
Dễ thấy G thỏa mãn điều kiện duy nhất trong phần thứ hai của định lý 1.3.17 1
và G sinh cùng một ngôn ngữ như văn phạm trước đây Cấu trúc tập con của 1
ta có khả năng mô phỏng đúng các dẫn xuất của văn phạm trước
Trang 28Định lý 1.3.18 Mọi ngôn ngữ phi ngữ cảnh không- (tức là không chứa từ rỗng) được sinh bởi một văn phạm mà mỗi sản xuất có dạng ABC hoặc
Aa , với A, B và C là các chữ không kết thúc và a là chữ kết thúc
Chứng minh: Ta từng bước loại trừ các sản xuất sai, trong khi luôn giữ cho
ngôn ngữ được sinh ra là bất biến
Ta bắt đầu với việc loại các sản xuất A (Văn phạm ban đầu của ta mà sinh ra ngôn ngữ đang được xem xét có thể có những sản xuất như vậy mặc dù
không thuộc ngôn ngữ) Trước hết ta xác định tập M gờm mọi chữ không kết thúc B với tính chất B* Điều này được thực hiện bằng cách mà theo đó các tập N(A) đã được xác định trong chứng minh trước: Trước hết ta lấy mọi chữ không kết thúc mà trực tiếp cho từ rỗng và sau đó ở mỗi bước ta mở rộng tập bằng cách thêm vào mỗi chữ không kết thúc trực tiếp sinh ra một từ gồm các chữ đã có mặt) Tập mới các sản xuất bây giờ gồm mọi sản xuất
,
A sao cho có một sản xuất A trong tập cũ các sản xuất và nhận được từ bằng cách xóa bớt đi một số bằng 0 hoặc lớn hơn lần xuất hiện của các phần tử của M Như vậy mọi sản xuất ban đầu được bảo toàn trừ các sản xuất A Hiệu quả của các sản xuất đó ( với ở vế phải) được khôi phục bằng cách dùng các biến thể xóa của các sản xuất ban đầu
Bước tiếp theo là để tránh các sản xuất dây chuyền AB, với mỗi chữ
ta xác định tập N'( ) gồm mọi chữ kết thúc và không kết thúc sao cho
*
Các tập N'( ) được xác định hầu như bằng cùng một cách như các
tập N(A) trong chứng minh trước Điều ngoại trừ duy nhất là bây giờ ta cũng
cần xét các sản xuất mà vế phải của chúng là một chữ kết thúc duy nhất Ta thấy rằng các sản xuất A đã bị loại trừ, do đó một dẫn xuất A* chỉ dùng các sản xuất bảo toàn độ dài
Tập mới các sản xuất bây giờ gồm mọi sản xuất Sa , trong đó S là chữ
Trang 29xuất phát của văn phạm và a là chữ kết thúc trong tập N S'( ), và mọi mọi sản xuất B1 n , n và mỗi 2 là một chữ sao cho trong tập cũ có một sản xuất A 1 n với tính chất
AN B'( ), iN'( ), i i1, ,n
Biến đổi này loại bỏ các sản xuất dây chuyền AB Dễ thấy biến đổi này không ảnh hưởng đến ngôn ngữ của văn phạm và các bộ chữ cái của văn phạm Còn lại hai biến đổi nũa Bước tiếp theo nhằm đảm bảo cho các chữ cái kết thúc chỉ xuất hiện trong các sản xuất có dạng Aa Xét mọi sản xuất
Định lý 1.3.19 Mỗi ngôn ngữ đệ quy kể được đều được sinh bởi một văn phạm
sao cho mỗi sản xuất có một trong các dạng
ABC, BCCD, A hay Aa
trong đó A, B, C, D là các chữ không kết thúc và a là chữ kết thúc
Chứng minh Trước hết ta loại các chữ kết thúc từ các sản xuất khác với Aa
bằng cách thay mỗi lần xuất hiện của chữ kết thúc a bởi một chữ không kết
thúc mới A và thêm vào sản xuất a A a Các sản xuất a x được thay thế bởi các sản xuất AAx và AxA , trong đó a chạy trên mọi chữ không kết
thúc Các sản xuất giảm độ dài
Trang 30Nếu m = 1 ta tiến hành như các sản xuất (4) trong chứng minh trước
Nếu m 2, ta đưa vào một chữ không kết thúc mới C và trước tiên thay (4) 2
Trang 311.4.1 Ôtômát hữu hạn đa định
Định nghĩa 1.4.1 Một ôtômát hữu hạn đa định là một bộ:
A = <Q, Σ, δ, I, T>,
trong đó:
+ Q là một tập hữu hạn khác rỗng, được gọi là tập các trạng thái
+ Σ là một bảng chữ hữu hạn các ký tự tác động của ôtômát
+ δ: D → Q, là một ánh xạ từ D vào Q (hàm đa trị bộ phận), trong đó D = Q
× Σ , được gọi là hàm chuyển trạng thái (hay hàm chuyển)
+ I Q được gọi là tập trạng thái khởi đầu
+ T Q được gọi là tập các trạng thái kết thúc
Trường hợp I 1 và δ là ánh xạ đơn trị thì A được gọi là ôtômát đơn định hữu hạn
1.4.2 Biểu diễn ôtômát hữu hạn đa định
Hàm chuyển trạng thái là một bộ phận quan trọng của một ôtômát hữu hạn
đa định Cho một ôtômát thực chất là cho hàm chuyển trạng thái của nó, có thể cho dưới dạng bảng chuyển hoặc cho dưới dạng đồ thị chuyển
Cho ôtômát bằng bảng chuyển
Cho ôtômát A= <Q, Σ, δ, I, T>, với Q = {q0, q1, q2, … , qm } là tập trạng thái,
và bảng chữ cái Σ = {a1, a2, … , an}, khi đó hàm chuyển có thể cho bởi bảng sau; trong đó dòng i cột j của bảng là ô trống nếu (qi, aj) ∉ D, tức là δ(qi,aj) không xác định
Trang 32
Trạng Thái
δ(qm, a1) δ(qm, a2 ) … δ(qm, a2)
Bảng chuyển trạng thái của ôtômát A
Cho bảng chuyển trạng thái, và chỉ rõ tập trạng thái kết thúc T, ta sẽ xác định được ôtômát A
Cho ôtômát bằng đồ thị chuyển
Cho ôtômát A= <Q, Σ, δ, I, T>, hàm chuyển δ có thể cho bằng một đa đồ thị
có hướng, có khuyên G sau đây, được gọi là đồ thị chuyển của ôtômát A Tập đỉnh của G được gán nhãn bởi các phần tử thuộc Q, còn các cung được gán nhãn bởi các phần tử thuộc Σ, tức là nếu aΣ và từ trạng thái q chuyển sang trạng thái p theo công thức δ(q, a) = p thì sẽ có một cung từ đỉnh q tới đỉnh p được gán nhãn a
Đỉnh vào của đồ thị chuyển là đỉnh ứng với trạng thái ban đầu q0 Các đỉnh
sẽ được khoanh bởi các vòng tròn, tại đỉnh q0 có mũi tên đi vào, riêng đỉnh với trạng thái kết thúc được phân biệt bởi vòng tròn đậm, hoặc hình vuông… 1.4.3 Ví dụ
Cho ôtômát hữu hạn đơn định:
Trang 33Đồ thị chuyển trạng thái của A 1
Ta có thể sử dụng ôtômát trên để đoán nhận ngôn ngữ * *
:
p up u
tất cả các xâu có tận cùng là p ) và đếm số lần xuất hiện xâu mẫu p trong một
xâu bất kỳ thuộc *p Chẳng hạn xét xâu w aagbababaa
Sử dụng ôtômát A 1 ta có thể mô tả quá trình đoán nhận xâu w như sau:
Trang 34Chương 2
Máy Turing và hàm đệ quy
Máy Turing là một khái niệm toán học nhằm chính xác hoá quan niệm thuật toán Mọi quá trình thuật toán bất kỳ đều là một trình tự thực hiện một số phép biến đổi sơ cấp nào đó Trong mô hình máy Turing, ta chỉ dùng một loại phép biến đổi sơ cấp đơn giản, đó là việc thay thế một ký hiệu này bởi một ký hiệu khác Hàm đệ quy và tập đệ quy là cách tiếp cận để xem xét bản chất tính toán của con người dựa trên quan điểm số học và logic truyền thống Hai cách tiếp cận này về tính toán có như nhau không Chương này nhằm là sáng tỏ vấn đề
đó thông qua luận đề Turing – Church Đồng thời trình bày một số kết quả không quyết định được cơ bản
2.1 Máy Turing
2.1.1 Thuật toán và máy Turing
Khái niệm trực giác về thuật toán đã được dùng từ lâu trong toán học Thuật toán là một số quy tắc xác định một quá trình tính toán nào đó Đầu thế kỉ 20, trong toán học xuất hiện một số bài toán mà việc có thuật toán để giải chúng là đáng nghi ngờ Để chứng minh một bài toán không có thuật toán để giải chúng thì trước hết ta cần có một định nghĩa toán học chính xác cho khái niệm thuật toán
Trong số các khái niệm toán học chính xác về thuật toán đã được nghiên cứu, các khái niệm máy Turing và hàm đệ quy là được thừa nhận rộng rãi nhất
và có nhiều thuận tiện cho việc nghiên cứu cả những vấn đề lý thuyết lẫn ứng dụng Khái niệm máy Turing mô tả một cách khoa học trên cơ sở phân tích tỉ
mỉ các quá trình thuật toán nói chung, nên ngoài các giá trị lý thuyết trừu tượng, nó còn là cở sở cho việc nghiên cứu các quá trình tính toán Khái niệm
Trang 35hàm đệ quy thuận tiện cho những nghiên cứu trừu tượng về các vấn đề tính được và giải được
Một máy Turing có một bộ phận điều khiển với một đầu viết, đầu viết này có nhiệm vụ đọc và viết các ký hiệu trên một băng tuyến tính được xem
đọc-là vô hạn cả về hai phía
a1 a1 … … a1 B B
Các bộ phận của máy Turing
Băng được chia thành từng ô, ở mỗi thời điểm đầu đọc viết nhìn một ô trên băng Các ký hiệu được ghi trên băng nằm trong một bảng chữ X nào đó, được gọi là bảng chữ của máy Bộ phận điều khiển hoạt động như một ôtômát
q
Trạng thái
Trang 36hữu hạn, ở mỗi thời điểm nó có thể ở một trạng thái trong một tập hữu hạn Q các trạng thái của nó Đầu đọc viết của máy có thể chuyển động trên băng sang trái hay sang phải Máy được xem là hoạt động trong quá trình thời gian rời rạc Bộ điều khiển có nhiệm vụ điều khiển toàn bộ quá trình hoạt động của máy Quá trình này bao gồm nhiều bước cơ bản, mỗi bước cơ bản được thực hiện trong khoảng thời gian giữa hai thời điểm kế tiệp nhau Mỗi bước cơ bản
gồm các nội dung sau: ở thời điểm t tuỳ theo trạng thái q của bộ phận điều khiển và ký hiệu x mà đầu đọc-viết đọc được trên băng, máy sẽ ghi một ký
hiệu x ' nào đó thay cho x, chuyển đầu đọc viết một ô sang trái hoặc sang phải, hoặc cũng có thể giữ đầu đọc viết đứng yên và bộ phận điều khiển sẽ chuyển sang một trạng thái q ' nào đó ở thời điểm t + 1 Các số liệu ban đầu được ghi trên băng trước khi máy bắt đầu hoạt động Sau khi máy dừng hoạt động, ta cũng sẽ đọc kết quả trên băng
Định nghĩa 2.1.1
Một máy Turing M là một bộ:
M Q X q, , ,1
trong đó:
Q là một tập hữu hạn các trạng thái của M
X là một bảng chữ hữu hạn không rỗng ( gọi là bảng chữ của máy)
q1Q là trạng thái ban đầu của máy
Trang 37băng: L có nghĩa là chuyển sang trái một ô, R có nghĩa là chuyển sang phải một
ô, N có nghĩa là không chuyển động
Giả sử qQ x, X' và q x , Khi đó q x, q y d', , cho ta một mệnh lệnh: nếu máy ở trạng thái q và nhìn ký hiệu x trên băng thì thay x bởi
y, chuyển đầu đọc-viết sang trái một ô hoặc đứng yên tuỳ theo
, hay N
d L R , và máy chuyển sang trạng thái q'
Ánh xạ thường được cho bởi một bảng gồm tất cả các từ dạng
qxdyq' (1)
trong đó q x , , q y d', , q x, Một từ dạng (1) được gọi là một lệnh của máy Một bảng lệnh của một máy Turing có tính chất là không thể có hai lệnh nào cùng có hai chữ đầu tương ứng giống nhau
Khi có bảng lệnh của máy M, ta cũng xác định được các tập Q và X của nó
Do đó một máy Turing M hoàn toàn được xác định bởi một bảng lệnh và một
trạng thái ban đầu
Một từ dạng:
CqD
trong đó qQ, CX' , D* X' được gọi là một hình trạng của máy M
Giả sử và là hai hình trạng của máy M Ta nói máy M chuyển trực
tiếp từ hình trạng sang hình trạng và viết
M : ( hay )
nếu xảy ra một trong các trường hợp sau:
1) CqxD, Cq yD' và máy có lệnh qxNyq'
2) Cqx x D1 2 , Cyq x D' 2 và máy có lệnh qx Ryq 1 '
3) Cqx, Cyq B' và máy có lệnh qxRyq'
4) Cx qx D1 2 , Cq x yD' 1 và máy có lệnh qx Lyq 2 '
Trang 385) qxD, q ByD' và máy có lệnh qxLyq'
Một hình trạng CqxD được gọi là hình trạng kết thúc nếu q x , ,
tức là nếu máy M không có lệnh nào bắt đầu bởi qx
Hình trạng kết thúc tương ứng với việc máy dừng
Khi máy chuyển từ sang và là hình trạng kết thúc ta viết
Giả sử M là máy Turing và PX* Ta nói máy M thích dụng cho từ P và
viết !!M P , nếu có một hình trạng kết thúc sao cho
q P1 ( hay q B1 nếu P )
Nếu X U , thì ta nói M biến P thành U và viết M P U
Máy M không thích dụng cho từ P nếu bắt đầu từ hình trạng q P ( hay 1 q B 1
nếu P ) máy không chuyển đến một hình trạng kết thúc nào cả
Khi M thích dụng cho P, quá trình máy chuyển từ hình trạng ban đầu q P 1
Trang 39dến hình trạng kết thúc được gọi là một quá trình tính toán của máy M trên
Máy M không thích dụng cho từ ca
Định nghĩa 2.1.3 Thuật toán là một máy Turing luôn luôn dừng Một máy Turing có thể không phải luôn luôn dừng được gọi là thủ tục
2.2 Hàm đệ quy
Khái niệm hàm đệ quy cũng là một khái niệm toán học, nhằm chính xác hóa khái niệm hàm tính được theo nghĩa trực giác, do đó chính xác hóa hóa khái niệm thuật toán nói chung Trước hết ta xét một lớp con đơn giản của lớp đó là lớp các hàm đệ qui nguyên thủy
2.2.1 Hàm đệ quy nguyên thủy
Giả sử f x 1, ,x n và g x 1, ,x n là hai hàm số n ngôi có thể không xác
định khắp nơi Ta ký hiệu
f x 1, ,x n g x 1, ,x n
để chỉ rằng với mọi x1, ,x n nếu một trong hai vế xác định thì vế kia cũng
Trang 40xác định và chúng có giá trị bằng nhau
Giả sử f y 1, ,y n, g x1 1, ,x n,…,g mx1, ,x n là các hàm số học có thể không xác định khắp nơi Ta nói hàm h x 1, ,x n được xác định bởi phép hợp thành từ các hàm số f g; 1, ,g nếu m
h x 1, ,x n f g x 1 1, ,x n, ,g mx1, ,x n
Giả sử f y x , , ,1 x n là một hàm số( có thể không xác định khắp nơi ) Ta nói hàm h x 1, ,x n là được xác định từ hàm f y x , , ,1 x n bằng phép cực tiểu hoá, và viết
Định nghĩa 2.2.1 Giả sử cho hai hàm số ( có thể không xác định khắp nơi ):
hàm n- ngôi f x 1, ,x n và hàm (n+2) – ngôi g x 1, ,x y z n, , Ta nói rằng hàm số h x 1, ,x y n, được xác định từ các hàm f và g bởi phép đệ quy
nguyên thuỷ, nếu với mọi số x1, ,x y ta có n,