Xuất phát từ tƣ tƣởng của giải thuật L* đƣợc đƣa ra trong[1], thực hiện huấn luyện dần dần tập trạng thái của giả định cần tìm. Tuy nhiên, chúng ta sẽ cải tiến cách
trả lời câu hỏi kiểm tra thành viên đã đƣợc đƣa ra trong giải thuật đó. Nhƣ đã đề cập ở trên, để học ngôn ngữ của giả định, giải thuật học L* sử dụng trong [1] đã xây dựng một bảng quan sát (S, E, T) trong đó T là một hàm thực hiện ánh xạ tập (S S. ).E
sang tập {true, false}. Với mỗi chuỗi s (S S. ).E, T(s) = true nếu s L(AW) và bằng false nếu ngƣợc lại. Trong trƣờng hợp s L(AW), chúng ta không chắc chắn đƣợc rằng s có nằm trong giả định đƣợc huấn luyện hay không (tức là, s L(A(p))?). Nếu s
L(A(p)) khi đó T(s) phải nhận giá trị false. Tuy nhiên, giải thuật trong [1] đặt T(s) là true trong trƣờng hợp này. Vì lý do này, giả định đƣợc tạo ra của giải thuật trong [1] không phải là giả định tối thiểu. Để giải quyết đƣợc hạn chế này, chúng tôi sử dụng một giá trị mới gọi là “?” để gán cho giá trị của T(s) trong trƣờng hợp trên. Chúng tôi định nghĩa một kỹ thuật cải tiến để trả lời câu hỏi kiểm tra thành viên nhƣ sau. Để tạo một giả định tối thiểu, giải thuật học L* cải tiến sẽ xây dựng một bảng quan sát (S, E, T), trong đó S và E tƣơng ứng là tập tiền tố và hậu tố. T là một hàm thực hiện ánh xạ tập (S S. ).E sang tập {true, false, “?”}, trong đó “?” có thể đƣợc xem nhƣ là một giá trị “chƣa xác định rõ”. Giá trị “chƣa xác định rõ” có nghĩa là với mỗi chuỗi
( . ).
s S S E, thậm chí s L(AW), chúng ta không biết s có nằm trong giả định đƣợc huấn luyện hay không. Chúng có thể nhận giá trị true hoặc false. Nếu nhận giá trị là true, tức là nó sẽ thuộc vào L(A(p)) còn nhận giá trị là false, tức là nó không thuộc vào L(A(p)). Câu trả lời cho câu hỏi kiểm tra thành viên đƣợc cải tiến nhƣ sau:
Một chuỗi s = a1, a2, ..., an (S S. ).E.
Nếu s = λ (chuỗi rỗng), khi đó T(s) = true.
Nếu s L(AW), thì T(s) = false.
Ngƣợc lại, T(s) = “?”.