Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích cú pháp - Lê Thanh Hương

19 97 0
Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích cú pháp - Lê Thanh Hương

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài giảng Xử lý ngôn ngữ tự nhiên: Phân tích cú pháp cung cấp cho người học các kiến thức: Bài toán PTCP, khái niệm về văn phạm, văn phạm, dạng chuẩn Chomsky, cấu trúc ngữ pháp, các ứng dụng của PTCP,... Mời các bạn cùng tham khảo nội dung chi tiết.

Bài tốn PTCP PTCP mẫu Phân tích cú pháp P Lê Thanh Hương Bộ môn Hệ thống Thông tin Viện CNTT &TT – Trường ĐHBKHN Email: huonglt-fit@mail.hut.edu.vn T tính C điể điểm câu P cú pháp Văn phạm độ xác Các PTCP có độ xác cao (Eisner, Collins, Charniak, etc.) Khái niệm văn phạm z z z Văn phạm Phân tích câu “Bò vàng gặm cỏ non” Cây cú pháp: Tập luật z z z z z z z z C Ỉ CN VN CN Ỉ DN VN Ỉ ĐgN ĐgN Ỉ ĐgT DN DN Ỉ DT TT z z z z z Một văn phạm sản sinh hệ thống G = ( T, N, S, R ), T (terminal) – tập ký hiệu kết thúc N (non terminal) – tập ký hiệu không kết thúc S (start) – ký hiệu khởi đầu R (rule) – tập luật R = { α Ỉ β | α, β ∈ (T∪N) } α Ỉ β gọi luật sản xuất Nhắc lại văn phạm Dạng chuẩn Chomsky z z Mọi NNPNC khơng chứa ε sinh từ văn phạm tnđó sản xuất có dạng A Ỉ BC A Ỉ a, với A,B,C∈N a ∈T Ví dụ: Tìm dạng chuẩn Chomsky cho văn phạm G với T = {a,b}, N ={S,A,B}, R sau: z z z S Ỉ bA|aB A ỈbAA|aS|a B Ỉ aBB|bS|b z z z z Văn phạm: tập luật viết lại Ký hiệu kết thúc: ký hiệu phân rã Ký hiệu khơng kết thúc: ký hiệu phân rã Xét văn ă phạm h G: G S → NP VP NP → John, garbage VP → laughed, walks G sinh câu sau: John laughed John walks Garbage laughed Garbage walks CuuDuongThanCong.com https://fb.com/tailieudientucntt Cấu trúc ngữ pháp Các ứng dụng PTCP Cây cú pháp biểu diễn cấu trúc ngữ pháp câu Bò vàng gặm cỏ non ƒ Dịch máy (Alshawi 1996, Wu 1997, ) C DT Bò CN VN DN ĐgN ĐgT gặm TT vàng tiếng Anh DN ƒ DT cỏ thao tác với tiếng Việt Nhận dạng tiếng nói sử dụng PTCP (Chelba et al 1998) Put the file in the folder Put the file and the folder TT non Văn phạm phi ngữ cảnh (Context-Free Grammar) Các ứng dụng PTCP ƒ Kiểm tra ngữ pháp ƒ Trích rút thơng tin (Hobbs 1996) … gọi văn phạm cấu trúc đoạn z G = z T – tập ký hiệu kết thúc (terminals) z N - tập ký hiệu không kết thúc (non-terminals) z P – ký hiệu tiền kết thúc (preterminals), viết lại trở thành ký hiệu kết thúc, thúc P⊂ Nphạm cảm ngữ cảnh So với văn z S – ký hiệu bắt đầu R: αAγ ⇒ αβγ z R: X → γ , X ký hiệu không kết thúc; γ chuỗi ký hiệu kết thúc khơng kết thúc (có thể rỗng) z Văn phạm G sinh ngôn ngữ L z Bộ nhận dạng: trả yes no z Bộ PTCP: trả tập cú pháp (Microsoft) CSDL Kho văn NY Times câu truy vấn z Văn phạm ngữ cấu: z z z z r = α→β, với α ∈ V+ , β ∈ V* , ⏐α⏐≤⏐β⏐ α1Aα2→α1β’α2 với β’≠ε Văn phạm phi ngữ cảnh: z z z Văn phạm phi ngữ cảnh α→β, với α ∈ V+ , β ∈ V* Văn phạm cảm ngữ cảnh: z 10 A → θ, A ∈ N, với ới θ ∈ V*= V* ( T ∪ N )* Văn phạm qui: A → aB, A → Ba, z A → a, với A, B ∈ N, a ∈ T z z VPCQ VPPNC VPCNC VPNC 11 CuuDuongThanCong.com 12 https://fb.com/tailieudientucntt Cấu trúc đoạn đệ qui Áp dụng tập luật ngữ pháp z S → NP VP → DT NNS VBD → The children slept p z S → NP VP → DT NNS VBD NP → DT NNS VBD DT NN → The children ate the cake 13 Văn phạm cho ngơn ngữ tự nhiên có nhập nhằng S PTCP kiểu xuống John saw snow on the campus S NP John 14 z Nhập nhằng - PP gắn điểm (với VP với NP) z z VP …… z z PP on NP z VP Hướng đích Khởi đầu với danh sách ký hiệu cần triển khai (S, NP,VP,…) Viết lại đích tập đích cách: z saw NP snow NP tìm luật có vế trái trùng với đích cần triển khai triểu khai với vế phải luật, tìm cách khớp với câu đầu vào Nếu đích có nhiều cách viết lại Ỉ chọn luật để áp dụng (bài tốn tìm kiếm) Có thể sử dụng tìm kiếm rộng (breadth-first search) tìm kiếm sâu (depth-first search) the campus 15 Khó khăn với PTCP xuống z Các luật đệ qui trái z PTCP xuống bất lợi có nhiều luật có vế trái 16 PTCP lên z S→NP X2 …… S→NP X600 z S→VP Y1 z z Nhiều thao tác thừa: triển khai tất nút phân tích xuống z z PTCP xuống làm việc tốt có chiến lược điều khiển ngữ pháp phù hợp z z PTCP xuống triển khai ký hiệu tiền kết thúc thành ký hiệu kết thúc Trên thực tế, người ta thường sử dụng phương pháp lên để làm việc z Lặp lại cơng việc: chỗ có cấu trúc giống CuuDuongThanCong.com VP …… z S→NP X1 S NP Hướng liệu Khởi tạo với xâu cần phân tích Nếu chuỗi tập đích phù hợp với vế phải luật → thay vế trái luật luật Kết thúc tập đích = {S} Nếu vế phải luật khớp với nhiều luật tập đích, cần lựa chọn luật áp dụng (bài tốn tìm kiếm) Có thể sử dụng tìm kiếm rộng (breadth-first search) tìm kiếm sâu (depth-first search) 17 18 https://fb.com/tailieudientucntt Thuật tốn CKY (bộ nhận dạng) Khó khăn với PTCP lên z z z Khơng hiệu có nhiều nhập nhằng mức từ vựng Lặp lại công việc: có cấu trúc chung Cả PTCP TD (LL) BU (LR) có độ phức tạp hàm mũ độ dài câu ƒ ƒ ƒ Vào: xâu n từ Ra: yes/no Cấu trúc ngữ g pháp: p p bảng g n x n ((chart table)) ƒ ƒ ƒ hàng đánh số đến n-1 cột đánh số đến n cell [i,j] liệt kê tất nhãn cú pháp i j 19 Thuật tốn CKY (bottom-up) ƒ ƒ 20 Ví dụ for i := to n ƒ Thêm tất từ loại từ thứ i vào ô [i-1,i] for width := to n ƒ for start := to n-width ƒ end := start + width ƒ for mid := start+1 to end-1 ƒ for nhãn cú pháp X [start,mid] ƒ for nhãn cú pháp Y [mid,end] ƒ for cách kết hợp X Y (nếu có) ƒ Thêm nhãn kết vào [start,end] chưa Bò vàng gặm DT C TT VN ĐgN ĐgT DT DN 10 11 12 13 14 15 22 Luật kết hợp V → ate Name → John Name → ice-cream, snow Noun → ice-cream, pizza Noun → table, guy, campus Det → the Prep → on Ô Cell[i,j] chứa nhãn X z z z z Có luật X→YZ; Cell[i,k] chứa nhãn Y ô Cell[k,j] chứa nhãn Z, với k nằm ằ i j; VD: NP → DT [0,1] NN[1,2] 23 CuuDuongThanCong.com TT Văn phạm phi ngữ cảnh Start→ S S → NP VP NP → Det Noun NP → Name NP → Name PP PP → Prep NP VP → V NP VP → V NP PP CN DN 21 non có nhãn cỏ 24 https://fb.com/tailieudientucntt CKY phải sử dụng luật nhị phân CKY chart “ The guy ate the ice-cream on z Chuyển VP→V NP PP thành: 8.a VP→V Arguments b Arguments → NP PP 8.b the table” DT NN VBD DT NN IN DT NN 25 26 Nhập nhằng! Áp dụng thao tác ‘dán’ 1 7 DT NP NN VBD DT NN IN DT NN 27 Thuật toán Earley (top-down) z B C + D D E A→BC.DE B C D VBD VP NP, Args DT NP NN IN DT PP NP NN 28 E NP → Papa N → caviar N → spoon V → ate P → with Det → the Det →a A→BCD.E 30 Tiến hành dần từ trái sang phải CuuDuongThanCong.com S 29 z DT NP NN ROOT → S S → NP VP NP → Det N NP → NP PP VP → VP PP VP → V NP PP → P NP A = Ví dụ Tìm nhãn nhãn thiếu (partial constituents) từ đầu vào z A → B C D E nhãn thiếu: A NP → NN PP 8.a VP→V Arguments 8.b Arguments → NP PP https://fb.com/tailieudientucntt Papa ate the caviar with a spoon Recursive Descent (Đệ quy) ROOT S NP NP →S → NP VP → Det N → NP PP VP → VP PP VP → V NP PP → P NP NP → Papa N → caviar N → spoon ROOT→ S V → ate P → with Det → the Det → a NP Papa VP VP →S → NP VP → Det N → NP PP VP → V NP VP → VP PP PP → P NP NP → Papa N → caviar N → spoon z z ƒ VP → V ƒ ƒ VP → V z z NP 2 NP → 2 NP → 0S NP → NP VP z sau = terminal, tìm đầu vào (“scan”) sau = rỗng, đích cha hồn chỉnh (“attach”) predict (đích tiếp theo) phân tích tiếp cuối … we hồn thành đích NP cha Ỉ attach 33 attach attach z ƒ →S → NP VP → Det N → NP PP VP → V NP VP → VP PP PP → P NP NP → Papa N → caviar N → spoon ƒ ƒ ƒ V → ate VP NP → ƒ NP → CuuDuongThanCong.com V → ate P → with Det → the Det → a thực lời gọi hàm: S() gọi NP() VP(), VP triển khai cách đệ qui cần quay lại để thử luật VP khác 34 →S → NP VP → Det N → NP PP VP → V NP VP → VP PP PP → P NP NP → Papa N → caviar N → spoon V → ate P → with Det → the Det → a ROOT → S ƒ S → NP VP ƒ VP → VP PP chỗ cần quay lại ƒ → V NP ƒ NP → Papa N → caviar N → spoon ƒ NP → Papa ƒ S → NP VP 1 V → ate VP → V NP VP → VP PP PP → P NP ƒ NP → Papa P ƒ NP → Papa ƒ ƒ S → NP VP ƒ NP → Papa VP → V NP 32 Papa ate the caviar with a spoon ROOT S NP NP ƒ S → NP VP ƒ PP PP PP Recursive Descent V → ate P → with Det → the Det → a ROOT → S ƒ VP → VP PP → NP VP → V NP ƒ V → ate ƒ V → ate z VP → V NP ƒ NP → ƒ NP → z VP → V NP S → NP VP VP Recursive Descent ROOT S NP NP → NP VP 0 NP → Papa p 0S z sau = nonterminal, lặp lặp lại việc tìm ký hiệu (“predict”) Papa ate the caviar with a spoon →S → NP VP → Det N → NP PP NP → Papa z ƒ NP → Papa z 0S z ƒ S → NP VP → V NP VP PP PP PP ROOT → S ƒ NP → Papa P V → ate 1 V → ate VP PP PP Papa ate the caviar with a spoon ROOT S NP NP ƒ S → NP VP ƒ PP VP→ VP PP Recursive Descent V → ate P → with Det → the Det → a ROOT → S VP → VP PP → VP PP 1 VP → VP PP stack overflowed VP 31 Recursive Descent z VP VP V → ate P → with Det → the Det → a VP → VP PP VP VP Papa ate the caviar with a spoon ROOT S NP NP NP → Papa N → caviar N → spoon VP→ VP PP VP→ VP PP VP→ VP PP Papa Goal stack → NP VP z ƒ NP → Papa VP → VP PP VP → V NP PP → P NP 0S ƒ S Root →S → NP VP → Det N → NP PP ROOT S NP NP z S → NP VP Recursive Descent ROOT → S z S → NP VP z NP → Papa z NP → Papa z S → NP VP z ƒ Papa ate the caviar with a spoon phân tích tiếp cuối cùng… đoạn NP từ đến 35 ƒ VP → VP PP 1 VP → VP PP 1 VP → VP PP 1 VP → VP PP stack overflowed không giải – cần thay đổi tập luật để loại trừ đệ qui trái https://fb.com/tailieudientucntt 36 Thuật toán Earley z z Thuật toán Earley giống thuật toán đệ qui nói trên, giải vấn đề đệ qui trái Sử dụng bảng phân tích giống thuật tốn CKY, nhằm lưu lại thơng tin tìm thấy Ỉ lập trình động “Dynamic programming.” khởi tạo ROOT S tương đương với (0, ROOT → S) Các thao tác thuật toán z Xử lý phần sau dấu theo kiểu đệ qui : z Nếu từ, quét (scan) đầu vào để xem có phù hợp khơng z Nếu ký hiệu khơng kết thúc, đốn (predict) khả để khớp (giảm số phép tiên đốn cách nhìn trước k ký hiệu từ đầu vào sử dụng luật phù hợp với k ký hiệu đó) z Nếu rỗng, ta hoàn thành thành phần ngữ pháp, gắn (attach) vào chỗ liên quan 37 0 ROOT S 38 predict luật có vế trái S ROOT S S NP VP S NP VP NP Det N predict luật có VT = NP (có luật phù hợp) NP NP PP (0, S → NP VP) NP Papa 39 40 0 ROOT S ROOT S S NP VP NP Det N S NP VP predict luật có VT = Det (2 luật) NP Det N NP NP PP NP NP PP NP Papa NP Papa 0D Dett th the 0D Dett th the Det a Det a predict luật có VT = NP ta làm việc bước trước, không làm lại! Chú ý: ta phải làm lại việc với luật đệ qui trái 41 CuuDuongThanCong.com 42 https://fb.com/tailieudientucntt Papa ROOT S 0 NP Papa ROOT S Papa S NP VP S NP VP NP Det N NP Det N NP NP PP NP Papa NP NP PP scan: từ phù hợp từ đầu vào NP Papa NP Papa 0D Dett th the 0D Dett th the Det a Det a scan: không khô phù hù hợp hợ 43 Papa ROOT S 44 0 NP Papa ROOT S Papa NP Papa S NP VP S NP VP attach NP tạo (bắt đầu từ 0) với phần liên quan (các phần chưa NP Det N NP NP PP hồn thành kết thúc có NP sau dấu ) NP NP PP S NP VP NP Det N NP NP PP NP Papa NP Papa 0D Dett th the 0D Dett th the scan: không phù hợp Det a Det a 45 Papa ROOT S 0 NP Papa ROOT S NP Papa S NP VP S NP VP NP Det N NP NP PP S NP VP S NP VP NP Det N NP NP PP predict NP NP PP VP V NP NP Papa 46 Papa predict NP NP PP VP V NP NP Papa VP VP PP 0D Dett th the VP VP PP 0D Dett th the PP P NP Det a Det a 47 CuuDuongThanCong.com 48 https://fb.com/tailieudientucntt Papa 0 NP Papa ROOT S S NP VP S NP VP S NP VP S NP VP NP Det N NP NP PP NP Det N NP NP PP ROOT S NP NP PP VP V NP predict Papa NP Papa NP NP PP VP V NP NP Papa VP VP PP NP Papa VP VP PP 0D Dett th the PP P NP 0D Dett th the PP P NP Det a V ate Det a V ate predict 49 Papa 50 0 NP Papa ROOT S S NP VP S NP VP S NP VP S NP VP NP Det N NP NP PP NP Det N NP NP PP ROOT S NP NP PP VP V NP NP Papa VP VP PP 0D Dett th the PP P NP Det a V ate Papa ate NP Papa V ate NP NP PP VP V NP predict NP Papa VP VP PP 0D Dett th the PP P NP Det a V ate P with scan: thành công! P with 51 Papa ate ROOT S NP Papa S NP VP NP Det N 52 V ate Papa ate ROOT S NP Papa V ate S NP VP S NP VP S NP VP VP V NP NP NP PP NP Det N NP NP PP NP NP PP VP V NP NP NP PP VP V NP NP Papa VP VP PP NP Papa 0D Dett th the PP P NP 0D Dett th the PP P NP Det a V ate Det a V ate P with attach scan: không hợp VP VP PP P with 53 CuuDuongThanCong.com 54 https://fb.com/tailieudientucntt Papa ROOT S ate 0 NP Papa V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP Papa ROOT S predict NP NP PP ate NP Papa V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP NP Papa VP VP PP NP Papa NP Papa 0D Dett th the PP P NP 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a V ate Det a P with predict (các bước sau tương tự) NP NP PP VP VP PP NP Papa P with 55 Papa ROOT S ate 56 0 NP Papa V ate ROOT S S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP NP NP PP predict Papa ate NP Papa V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP NP NP PP NP Papa VP VP PP NP Papa NP Papa VP VP PP NP Papa 0D Dett th the PP P NP 2D Dett th the 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a Det a V ate Det a P with scan (lúc thất bại P Papa khô hải từ tiếp tiế theo) P with 57 Papa ROOT S ate the NP Papa V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP NP Papa Det the NP NP PP PP P NP 2D Dett th the Det a V ate Det a Papa ROOT S ate P with the V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP Papa scan: thành h công! ô ! NP Papa NP NP PP VP V NP VP VP PP NP Papa 0D Dett th the 58 Det the NP NP PP VP VP PP NP Papa 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a P with 59 CuuDuongThanCong.com 60 https://fb.com/tailieudientucntt Papa ROOT S ate the 0 NP Papa V ate Det the ROOT S S NP VP S NP VP VP V NP NP Det N NP Det N NP NP PP NP Det N NP NP PP VP V NP NP NP PP Papa ate the NP Papa V ate Det the S NP VP S NP VP VP V NP NP Det N NP Det N NP NP PP NP Det N NP NP PP VP V NP NP Papa VP VP PP NP Papa NP Papa 0D Dett th the PP P NP 2D Dett th the 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a Det a V ate Det a P with N caviar NP NP PP N spoon VP VP PP NP Papa P with 61 Papa ROOT S ate the N caviar ROOT S NP Papa V ate Det the NP Det N S NP VP S NP VP VP V NP NP Det N N caviar NP Det N NP NP PP NP Det N NP Papa V ate Det the S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP caviar 62 NP NP PP N spoon Papa ate NP NP PP VP V NP caviar N caviar N caviar NP NP PP N spoon NP Papa VP VP PP NP Papa NP Papa 0D Dett th the PP P NP 2D Dett th the 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a Det a V ate Det a P with the VP VP PP NP Papa P with 63 Papa ate the caviar ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N NP NP PP VP V NP NP Papa 64 attach N caviar NP NP PP N spoon Papa ate caviar V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP NP PP VP V NP NP NP PP N spoon NP Papa 0D Dett th the PP P NP 2D Dett th the 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a Det a V ate Det a attach NP NP PP VP VP PP NP Papa P with 65 CuuDuongThanCong.com NP Papa VP VP PP NP Papa P with the ROOT S 66 https://fb.com/tailieudientucntt Papa ate the ROOT S NP Papa V ate S NP VP S NP VP VP V NP NP Det N NP NP PP NP Det N NP NP PP VP V NP caviar Det the N caviar ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N NP Det N N caviar VP V NP NP NP PP N spoon attach Papa ate NP NP PP NP NP PP VP V NP the caviar NP NP PP N spoon NP NP PP NP Papa VP VP PP NP Papa S NP VP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP Det a V ate Det a Det a V ate Det a PP P NP P with P with 67 Papa ate 0 ROOT S NP Papa V ate Det the N caviar ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N NP NP PP NP Det N N caviar VP V NP NP NP PP NP NP PP VP V NP NP NP PP VP V NP the caviar 68 NP NP PP N spoon NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the Det a V ate Det a P with attach Papa ate the caviar NP NP PP N spoon NP NP PP NP Papa VP VP PP NP Papa S NP VP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP PP P NP Det a V ate Det a PP P NP ROOT S P with ROOT S 69 Papa ate the caviar 70 Papa ate the caviar ROOT S NP Papa V ate Det the N caviar ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N NP NP PP NP Det N N caviar VP V NP NP NP PP NP NP PP VP V NP NP NP PP VP V NP NP NP PP N spoon NP NP PP N spoon NP NP PP NP Papa VP VP PP NP Papa S NP VP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP Det a V ate Det a PP P NP Det a V ate Det a PP P NP P with ROOT S P with P with P with 71 CuuDuongThanCong.com ROOT S 72 https://fb.com/tailieudientucntt Papa ate the caviar ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon with P with Papa ate the caviar with NP Papa V ate Det the N caviar P with NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N PP P NP VP V NP NP Det N NP NP PP NP Det N N caviar VP V NP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP Det a V ate Det a PP P NP Det a V ate Det a PP P NP P with ROOT S ROOT S NP NP PP N spoon NP NP PP P with ROOT S P with P with 73 Papa ate the caviar with 74 Papa ate the caviar with ROOT S NP Papa V ate Det the N caviar P with ROOT S NP Papa V ate Det the N caviar P with S NP VP S NP VP VP V NP NP Det N NP Det N PP P NP S NP VP S NP VP VP V NP NP Det N NP Det N PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N NP NP PP VP V NP NP NP PP N spoon NP NP PP NP NP PP NP NP PP N spoon NP NP PP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP D Dett th the Det a V ate Det a PP P NP Det a V ate Det a PP P NP P with NP Papa NP NP PP VP V NP P with ROOT S NP Papa Det a ROOT S P with P with 75 Papa ate the caviar ROOT S NP Papa V ate Det the S NP VP S NP VP VP V NP NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon with N caviar 76 Papa ate the caviar with ROOT S NP Papa V ate Det the NP Det N PP P NP S NP VP S NP VP VP V NP NP Det N NP Det N PP P NP VP V NP NP Det N NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N P with NP NP PP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP D Dett th the 0D Dett th the PP P NP 2D Dett th the VP VP PP D Dett th the Det a V ate Det a PP P NP Det a V ate Det a PP P NP P with NP Papa Det a ROOT S NP NP PP N spoon N caviar P with P with P with NP Papa Det a ROOT S P with 77 CuuDuongThanCong.com NP NP PP NP NP PP 78 https://fb.com/tailieudientucntt Papa ate the caviar with ate the V ate Det the S NP VP S NP VP VP V NP NP Det N NP Det N PP P NP P NP Det N NP NP PP NP Det N N caviar VP V NP NP Det N PP NP Det N NP NP PP N spoon P with NP Papa NP NP PP VP V NP N caviar ROOT S V ate caviar Det the VP V NP with N caviar P with NP Det N NP Det N PP P NP N caviar VP V NP NP Det N NP NP PP NP NP PP P PP NP Papa S NP VP P 2D Dett th the VP VP PP D Dett th the Det a PP P NP NP Papa VP VP PP NP Papa S NP VP 0D Dett th the PP P NP 2D Dett th the VP VP PP D Dett th the Det a V ate Det a PP P NP P with NP Papa Det a NP NP PP N spoon a Det a NP NP PP NP NP PP ROOT S ROOT S P with P with NP Papa Det a 79 ate P the V ate VP V NP PP NP Det N P caviar Det the with N caviar Det a NP Det N NP Det N NP Det N PP P NP N caviar VP V NP NP Det N NP NP PP N spoon a P with 80 ate P the V ate caviar Det the VP V NP PP NP Det N with 5 Det a NP Det N NP Det N PP P NP NP Det N N caviar VP V NP NP Det N N caviar P PP NP Papa S NP VP PP NP Papa S NP VP P 2D Dett th the VP VP PP D Dett th the P 2D Dett th the VP VP PP D Dett th the Det a PP P NP Det a PP P NP Det a P with NP NP PP NP NP PP NP Papa a N caviar NP NP PP N spoon NP NP PP NP NP PP N spoon ROOT S ROOT S P with P with NP Papa Det a 81 ate P the V ate VP V NP PP NP Det N P caviar Det the with a 82 ate the P with NP Det N NP Det N PP P NP NP Det N P N caviar VP V NP NP Det N N caviar PP NP Det N NP NP PP N spoon Det a N caviar V ate caviar Det the VP V NP with NP Det N NP Det N PP P NP NP Det N VP V NP NP Det N N caviar P S NP VP PP NP Papa S NP VP P 2D Dett th the VP VP PP D Dett th the P 2D Dett th the VP VP PP D Dett th the Det a PP P NP NP NP PP N spoon Det a PP P NP Det a N spoon NP NP PP NP NP PP N spoon ROOT S ROOT S P with P with NP Papa Det a 83 CuuDuongThanCong.com spoon N caviar NP NP PP NP NP PP N spoon Det a P with PP NP Papa NP Papa a N caviar 84 https://fb.com/tailieudientucntt ate P the V ate VP V NP PP NP Det N P caviar Det the with a spoon ate P with Det a N spoon NP Det N NP Det N PP P NP NP Det N NP Det N P N caviar VP V NP NP Det N N caviar NP NP PP N spoon PP NP Papa P N caviar the V ate VP V NP PP NP Det N NP NP PP NP NP PP N spoon P S NP VP PP NP Papa NP Papa 2D Dett th the VP VP PP D Dett th the Det a PP P NP P Det a caviar Det the with a spoon N caviar P with Det a NP Det N NP Det N PP P NP NP Det N NP Det N N caviar VP V NP NP Det N N caviar PP P NP NP NP PP N spoon NP NP PP NP NP PP N spoon S NP VP 2D Dett th the VP VP PP D Dett th the PP P NP ROOT S P with P with NP NP PP NP Papa Det a ROOT S N spoon Det a 85 Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon 86 … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP Det a V ate Det a PP P NP PP P NP P with ROOT S NP NP PP N spoon … N spoon P with ROOT S P with P with 87 Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon 88 … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP VP V NP NP NP PP NP NP PP NP NP PP N spoon … N spoon NP Det N NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP PP P NP Det a V ate Det a PP P NP PP P NP ROOT S VP V NP ROOT S VP V NP P with NP NP PP P with NP NP PP P with P with S NP VP VP VP PP 89 CuuDuongThanCong.com 90 https://fb.com/tailieudientucntt Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP VP V NP NP NP PP NP NP PP NP NP PP N spoon … N spoon NP Det N NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP PP P NP Det a V ate Det a PP P NP PP P NP ROOT S VP V NP ROOT S VP V NP P with NP NP PP P with NP NP PP P with Papa ate the caviar NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon S NP VP S NP VP VP VP PP VP VP PP P with P with 91 92 with a spoon ROOT S P with … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP PP P NP Det a V ate Det a PP P NP PP P NP ROOT S VP V NP ROOT S VP V NP P with NP NP PP P with NP NP PP P with NP NP PP N spoon … N spoon P with S NP VP S NP VP VP VP PP VP VP PP P with P with ROOT94S 93 Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP PP P NP Det a V ate Det a PP P NP PP P NP ROOT S VP V NP ROOT S VP V NP P with NP NP PP P with NP NP PP P with CuuDuongThanCong.com NP NP PP N spoon … N spoon P with S NP VP S NP VP VP VP PP VP VP PP P with P with ROOT95S ROOT96S https://fb.com/tailieudientucntt Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N NP NP PP NP Det N N caviar NP NP PP VP V NP NP NP PP N spoon … N spoon Papa ate the caviar with a spoon ROOT S NP Papa V ate Det the N caviar NP Det N S NP VP S NP VP VP V NP NP Det N NP Det N NP Det N VP V NP PP P NP NP Det N NP NP PP NP Det N N caviar VP V NP PP P NP NP NP PP NP NP PP NP NP PP NP NP PP NP NP PP VP V NP NP Papa VP VP PP NP Papa S NP VP NP NP PP NP Papa VP VP PP NP Papa S NP VP NP NP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP 0D Dett th the PP P NP 2D Dett th the VP VP PP VP VP PP Det a V ate Det a PP P NP PP P NP Det a V ate Det a PP P NP PP P NP ROOT S VP V NP ROOT S VP V NP P with NP NP PP P with NP NP PP P with P with S NP VP S NP VP VP VP PP VP VP PP P with P with ROOT97S ROOT98S Vấn đề với PTCP xuống: đệ qui trái … thuật toán Earley Ok! VP VP VP VP VP VP gắn liên tục luật vào trước thấy PP PPs Ỉ cần đoán trước số PP cần đầu vào PP PP PP NP NP PP N spoon … N spoon VP → VP PP PP (cột 1) attach VP VP → VP PP VP PP NP V ate the caviar (cột 4) 99 … thuật toán Earley Ok! VP PP VP 100 … thuật toán Earley Ok! VP VP → VP PP dùng lại VP (cột1) PP VP → VP PP dùng lại (cột1) VP attach VP VP VP → VP PP PP VP VP PP with a spoon VP → VP PP PP in his bed VP PP with a spoon NP V ate the caviar NP V ate the caviar (cột 7) (cột 10) 101 CuuDuongThanCong.com 102 https://fb.com/tailieudientucntt Phục hồi cú pháp … thuật toán Earley Ok! VP PP VP (cột1) [s,itrong tập trạng thái j Sử dụng thuật toán dùng queue đơn giản, dựa thành phần có ích • thành phần trạng thái kết thúc có ích q r • If s=[A →α•Β,i] tập đích k & có ích γ α • then q=[A →αΒ •,k] & item r= [B →γ •,j] có ích i k j VP → VP PP dùng lại VP attach VP VP → VP PP PP VP [s,i] : thành phần với luật s & trả trỏ i PP in his bed VP PP with a spoon NP V ate the caviar (cột10) 103 Ưu điểm z Đánh dấu tất thành phần tập trạng thái Sn dạng Start → αS•, for j=n downto for i=0 to j for đánh dấu [s,i] tập trạng thái j for k=i to j if [q,i]∈Sk & [r,k] ∈Sj & s= q⊗r then 104 đánh dấu [q,i] [r,k] Nhược điểm Thuật toán Earley thực vài phép lọc top-down: thành phần (state, or triple) đưa vào tập trạng thái cần tương thích với phần sinh bên trái trái Ví * w w phần câu dụ: S⇒ i i duyệt qua S z Biểu diễn luật: Explicit representation of rules: wastes time building them z Thực phép lọc bên trái không lọc bên phải Phép lọc nhìn trước cho ký hiệu khơng kết thúc A: FIRST(A)= {x|A ⇒ xδ }, x= token wi v.d., FIRST(S)= who, did, the, etc 105 106 PTCP việc tìm kiếm Các phương pháp khác the guy saw ice-cream on the hill S(0, 7) z Các phương pháp khác ứng với cách khác để tìm đoạn z Đoạn X[i, j] đoạn có nhãn X phủ đầu vào từ I đến j Example: ice cream on the table John ate ice-cream PP[3,6]; S[0,6]; … Biểu diễn khơng gian tìm kiếm and-or z Disjuncts (or) = đường phân tích khác z Conjuncts (and) = vế phải luật, ví dụ vế phải S NP VP z NP(0, 1) VP(1, 8) NP(0, 2) VP(2, 7) Name (0, 1) V(1, 2) Det(0,1) Noun(1, 2) V(2, ( 3)) the guy NP(3,7) ( , ) NP(3, NP(3 4) saw Name(3, 4) ice-cream PP(4, 7) Prep(4, 5) on NP(5,7) Name(5,6) 107 CuuDuongThanCong.com https://fb.com/tailieudientucntt NP(5, 7) Det(5,6) Noun(6,7) the 108 hill PTCP góc trái (Left-corner parsing) S Nhìn từ lên để tìm ký hiệu (left-corner) đoạn, sau phân tích phần NP lại theo kiểu xuống ố z Tìm cách kết hợp predict đặc trưng tốt tìm phân tích the xuống lên Noun tìm S→ NP VP z NP→ the Noun VP VP→ ate NP ate Phương pháp làm việc tốt với ngôn ngữ với thành phần quan trọng đặt đầu tiếng Anh Các tiếng Đức, 109 Hà Lan, Nhật ngơn ngữ có phần quan trọng đặt cuối CuuDuongThanCong.com https://fb.com/tailieudientucntt ... loại từ thứ i vào ô [i-1,i] for width := to n ƒ for start := to n-width ƒ end := start + width ƒ for mid := start+1 to end-1 ƒ for nhãn cú pháp X [start,mid] ƒ for nhãn cú pháp Y [mid,end] ƒ for... (Left-corner parsing) S Nhìn từ lên để tìm ký hiệu (left-corner) đoạn, sau phân tích phần NP lại theo kiểu xuống ố z Tìm cách kết hợp predict đặc trưng tốt tìm phân tích the xuống lên Noun tìm S→ NP VP...Cấu trúc ngữ pháp Các ứng dụng PTCP Cây cú pháp biểu diễn cấu trúc ngữ pháp câu Bò vàng gặm cỏ non ƒ Dịch máy (Alshawi 1996, Wu 1997, )

Ngày đăng: 11/01/2020, 19:39

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan