2. Giải quyết bài toán dịch ngôn ngữ tự nhiên sang ngôn ngữ đặc tả
2.4. Chuyển văn bản từ ngôn ngữ tự nhiên sang dạng ngôn ngữ tiền đặc tả
Để cho bài toán giảm đi độ phức tạp khi chuyển từ ngôn ngữ tự nhiên sang ngôn ngữ đặc tả ta cần qua bước trung gian là chuyển văn bản đầu vào về dạng ngôn ngữ tiền đặc tả, rồi lấy kết quả từ tiền đặc tả chuyển qua đặc tả.
Trước hết ta sẽ xem các ví dụ để đưa ra thuật toán giải quyết vấn đề:
Ví dụ 1: cho tam giác ABC. Cạnh AB = 5 cm, cạnh BC = 10 cm, cạnh AC = 8 cm. Tính chu vi tam giác ABC.
Trước hết ta cần tách đoạn văn bản ra thành từng câu riêng biệt và chuyển chúng về dạng mẫu câu với các thành phần chính:
- Cho tam giác ABC → cho|đối tượng|tên → tiền đặc tả: cho|[tên, “đối tượng”] - Cạnh AB = 5 cm, cạnh BC = 10 cm, cạnh AC = 8 cm.
Đối tượng|tên|tính chất|số lượng| đối tượng|tên|tính chất|số lượng| đối tượng|tên| tính chất|số lượng|
Tiền đặc tả: [tên,“đối tượng”]=số lượng|[tên,“đối tượng”]=số lượng|[tên,“đối tượng”]=số lượng
- Tính chu vi tam giác ABC → Tính|thuộc tính|đối tượng|tên Tiền đặc tả: [“Tính”,[tên,“đối tượng”].thuộc tính]
Sau khi đưa về dạng mẫu câu với các đối tượng chính ta sẽ tách câu thành từng từ và đưa chúng về dạng tiền đặc tả của từng loại mẫu câu theo định nghĩa trước.
- Cho|tam giác|ABC → Cho|[ABC,“tam giác”] - Cạnh|AB|=|5|Cạnh|BC|=|10|Cạnh|AC|=|8
[AB,“cạnh”]=5|[BC,“cạnh”]=10|[AC,“cạnh”]=8 - Tính|chu vi|tam giác|ABC
Ví dụ 2: cho điểm M là trung điểm đoạn BC. Đoạn BC = 5 cm. Chứng minh đoạn BM và đoạn MC bằng nhau.
- Cho điểm M là trung điểm đoạn BC Cho|đối tượng|tên|là|đặc điểm|đối tượng|tên
Tiền đặc tả: Cho|[tên,“đối tượng”],[tên,“đối tượng”]|[“đặc điểm”, tên, tên] - Đoạn BC = 5 cm → đối tượng| tên|tính chất|số lượng
Tiền đặc tả: [tên,“đối tượng”]=số lượng
- Chứng minh đoạn BM và đoạn MC bằng nhau → chứng minh|đối tượng|tên| và|đối tượng|tên|tính chất
Tiền đặc tả: [“Chứng minh”,[“tính chất”, tên, tên]] Đoạn văn bản với ngôn ngữ tiền đặc tả:
- Cho|điểm|M|là|trung điểm|đoạn|BC
Cho|[M,“điểm”],[BC,“đoạn”]|[“trung điểm”, M, BC] - Đoạn|BC|=|5 -> [BC, “đoạn”]=5
- Chứng minh|đoạn|BM|đoạn|CM|bằng nhau [“chứng minh”,[“bằng nhau”, BM, MC]] Từ các ví dụ trên ta đưa ra thuật toán như sau:
B1: tách đoạn văn thành từng câu riêng biệt B2: tách câu thành từng từ riêng biệt
B3: duyệt từng câu chuyển thành dạng mẫu câu theo từ loại
B4: lấy dạng tiền đặc tả ứng với mẫu câu đó trong file mẫu câu và tiển đặc tả
B5: duyệt mẫu tiền đặc tả lấy từ theo từ loại tương ứng. B6: ngôn ngữ tiền đặc tả bài toán.
Hì
nh 4.3: sơ đồ giải thuật chuyển ngôn ngữ tự nhiên sang ngôn ngữ tiền đặc tả.