.7 Kết hợp 2 mơ hình Char L2R và Char R2L để sửa lỗi tiếng Ba Na

Một phần của tài liệu Xây dựng mô hình ngôn ngữ và sửa lỗi tiếng ba na tự động (Trang 45 - 46)

Input: Yôl tơ'nglaih kơpô lơ̆m tơmăn 'nhct jê̆ 'bău

================== STEP 1 =====================

Model left: yôl tơ'nglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău Prob: 0.9992953538

Model right: yôl uơ'nglaih kơpô lơ̆m tơmăn 'nhct jê̆ 'bău Prob: 0.5149679183 Choose model left: yôl tơ'nglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău

================== STEP 2 =====================

Model left: yôl tơmnglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău Prob: 0.9371384978 Model right: yôl uơ'nglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău Prob: 0.5149679183 Choose model left: yôl tơmnglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău

End

================== Result ===================== Input : Yôl tơ'nglaih kơpô lơ̆m tơmăn 'nhct jê̆ 'bău

Output : yôl tơmnglaih kơpô lơ̆m tơmăn 'nhăt jê̆ 'bău

Input: 'Boi thu 'yŏk điêu tra ra soat ŭnh hnxm dơnuh atŭc

================== STEP 1 =====================

Model left: 'boi thu 'yŏk điêu tra ra soat ŭnh hnam dơnuh atŭc Prob: 0.999995708

Model right: 'loi thu 'yŏk điêu tra ra soat ŭnh hnxm dơnuh atŭc Prob: 0.653470814

Choose model left: 'boi thu 'yŏk điêu tra ra soat ŭnh hnam dơnuh atŭc ================== STEP 2 ===================== Model left: Prob: 0.0

Model right: 'loi thu 'yŏk điêu tra ra soat ŭnh hnam dơnuh atŭc Prob: 0.653470814

37

End

================== Result ===================== Input : 'Boi thu 'yŏk điêu tra ra soat ŭnh hnxm dơnuh atŭc Output : 'loi thu 'yŏk điêu tra ra soat ŭnh hnam dơnuh atŭc

Với kết quả thực nghiệm trên người dùng sẽ nhập một chuỗi ký tự vào hệ thống, hệ thống sẽ phát hiện ký tự sai và tiến hành thay thế ký tự đúng với cả hai mơ hình ngơn ngữ Char L2R và Char R2L rồi so sánh xác suất có khả năng xảy ra cao nhất để chọn ra mơ hình tốt hơn. Mơ hình vẫn sẽ tiếp tục nếu phát hiện ký tự sai và tiến hành thay thế ký tự đúng trên cả hai mơ hình ngơn ngữ Char L2R và Char R2L rồi so sánh xác suất có khả năng xảy ra cao nhất để chọn ra mơ hình tốt hơn cho đến khi tìm ra kết quả có xác xuất tốt nhất.

4.4.4. Kết quả mơ hình ngơn ngữ mức ký tự tiếng Ba Na Look-ahead

Qua thực nghiệm tơi nhận thấy mơ hình Char L2R có xác suất đúng cao hơn, nên với mơ hình ngơn ngữ mức ký tự tiếng Ba Na Look-ahead chỉ trên mơ hình Char L2R. Với ý tưởng:

Hàm def correct_one_mistake_with_Look-ahead: Thực hiện việc sửa lỗi trên mơ hình trái sang phải

Gặp một ký tự có xác suất thấp dưới ngưỡng đưa ra (0.001), thay vì thay thế bằng kí tự có xác suất cao nhất thì sẽ tạo ra danh sách ứng viên gồm ký tự hiện tại và danh sách các kí tự có xác suất cao nhất.

Sau đó tính xác suất xuất hiện của ký tự tiếp theo với từng ứng viên rồi chọn ra xác suất của cao nhất ứng với ứng viên để chọn ứng viên làm kí tự thay thế.

Ví dụ:

Một phần của tài liệu Xây dựng mô hình ngôn ngữ và sửa lỗi tiếng ba na tự động (Trang 45 - 46)

Tải bản đầy đủ (PDF)

(62 trang)