Như đă giới thiệu trong chương 1, CBR là phương pháp giải quyết vấn đề dựa trên việc áp dụng lời giải cùa bài toán cũ vào bài toán mới có dữ kiện tương tự. Trong quá trình áp dụng, lời giải cũ có thể được hiệu chình để phù hợp với bài toán mới. CBR đang thu hút mổi quan tâm ngày càng lớn do có nhiều điềm tươne đồng với cách giải quyết vấn đề cùa con người. Phương
Tính độ tương lự và irtĩg dụng trong CBR 1/1/2006
pháp này tò ra ưu việt so với các phương pháp lập luận truyền thống dựa trên luật (rule-based reasoning) trong những bài toán có miền tri thức rộng, các bài toán không có những quy luật tổng quát hoặc có quá nhiều luật.
Một trong những vấn đề khó khăn nhất ưong CBR là tính độ tương tự giừa các ca lập luận (cases) phục vụ cho giai đoạn tìm kiếm lại. Hàm tính độ tương tự có ành hường rất lớn đến hiệu quả và độ chinh xác của các hệ thống CBR. Hiện nay, các phương pháp tính độ tương tự là dựa trên các độ đo khoảng cách như khoảng cách Hamming, khoảng cách ơclit, khoảng cách Mahatta, các khoảng cách mờ [21]... Theo các phương pháp này, độ tương tự giữa các ca lập luận được tính là tổng có trọng số độ tương tự giữa các cặp thuộc tính bời một hàm số gọi là hàm tương tự. Mỗi trọng số tương ứng với mỗi thuộc tính trong hàm tương tự thể hiện tầm quan trọng của mồi thuộc tính trong đặc tả ca lập luận, thông thường, thuộc tính có giá trị trọng số lớn sẽ có tầm quan trọng lớn. Do đó, các trọng số có ảnh hường rất lớn tới độ chính xác của hàm tương tự và vì vậy ảnh hưởng tới chất lượng của toàn bộ hệ thống CBR. Cho tới hiện nay, việc gán ưọng số cho thuộc tính chủ yếu vẫn được xác định một cách cảm tính bởi các chuyên gia miền bài toán. Các chuyên gia có thể khẳng định ca lập luận này giống với ca lập luận kia hơn ca lập luận khác (chủng tôi gọi là đánh giá chung) và có thể lượng hỏa thành một giá trị (độ tương tự), nhưng họ rất khó để đưa ra được trọng số cho hàm tương tự đề thể hiện đánh giá chung đó. Trên thực tế, bộ trọng số đưa ra một cách cảm tính này thường không giúp cho hàm tương tự có kết quả như đánh giá chung mà chuyên gia mong muốn.
Để hiểu rõ vấn đề bài toán cần giải quyét, chúng ta hãy xét một ví dụ cụ thể về hệ thống CBR hỗ trợ việc chẩn đoán sửa chữa xe ô tô. Giả sừ hệ thống
Tính độ tương tự và img dụng trong CBR 1/1/2006
cỏ cơ sở tri thức eôm hai ca lập luận như hình 3.1. Mỗi ca lập luận được đặc tả gồm hai phần: đặc tả bài toán (problem) và lời giải (solution).
CASE 1
Problem (Symptoms)
• Problem: Front i(jht doesn't work
• Car. VWGolf III. 1.61 Solution
* Year. 1996 • Diagnosis Front light fuse delect • Battery voltage: 13.6 V • Repair: Replace front light fuse • State ot lights. CK
* State of light s*t*ch. OK
a) Đặc tà ca lập luận giải quyểt bài toán “đèn trước bị hỏng ” của x e v w
G o lf III, 1 .6 / .
CASE 2
Problem (Symptoms)
• Problem: Front light doesn't work
• Car Audi A4 Solution
• year: 1997 • Diagnosis: Bulb defect
• Battery voltage 12.9 V • Repair: Replace front light
• State of lights: surface damaged • State of tight switch: OK
b) Đặc tả ca lập luận giải quyết bài toán "đèn trước bị hỏng ” của x e Audi A4.
Hình 3.1- Đặc tả các ca lập luận về hỏng xe (CASE 1 và CASE 2).
Giả sử chúne ta có bài toán mới được đặc tả nhu hình 3.2:
Problem (Symptom)
• Problem: Back light doesn’t work • Car. Audi 80
Yoar. 1989
Battery voltage. 12.6 V
_______ State of light: OK____________________________ Hình 3.2 - Đặc ỉả bài toán mới.
Chúng ta cần tim lời giài cho bài toán này bằng cách đi tìm ừong cơ sở tri thức ca lập luận có đặc tả bài toán tương tự nhất với nó. Đẻ tìm được ca lập luận tương tự, trước hết chúng ta phải tính độ tương tự của ca lập luận mới
Tinh độ lươ ng lự và ừ n g dụng trong C B R ỉ / ] /20 06
với tất cà các ca lập luận của hệ thống theo công thức (2.21). Già sử trọng sổ của thuộc tính quan trọng là 6, của thuộc tính ít quan trọng là 1. Quá trình tinh độ tương tự giừa các ca lập luận được mô tả bởi hình 3.3.
Bm. to án mói (CASE 3) CASE i h t U m e y n y t e m )
■ Problvnr: B id* lig h td o n n twoiW 0Jt P rcbtem (S y m p to m s)
PioblM' Front light d oesn 't MIO v
Solu tion
• OvgnosrT: FrantligM Alse
d«f*ct
* fí*ptir Replace fro rt í ị M
fllM ■ Car. Au dl 8 0 ......M... • Car. VW OoK III, 1 .6 1
• Ytar. 1860 06 • Year. 1 c ee OS ßaheiy voltige: 1 3 .6 V ► * Sfefp oflights' OK ....14) • Sb&oflig>t ữùtoh OK Sún (3.1) -1/20 * ( 6*0.8 + 1*0.4 + 1*0.6 + 6*0.9+ 6* 1.0) - 0.8Ố
a) Túih độ tu ơ n g tự giũa ca lặ p lu ậ n m ớ i và ca lậ p lu ận CASE 1.
B« »ánmái (CASE 3)______ CASE 2 I M l f l i (SymptwuJ
01 P rcb lem (S y m p to m s)
S o lu tion
* Diagnosis: Bulù dtSoct
* Repair: c * fiont fghi
. P a r ^ ... . OB CữrA/ứỉAI
• yiM r 1060 0.4 YeJt; 199?
• uo/iaye: 12 0 V - 0.3 5 Battery (QIÖ2*.12,9 V
• Stele of light OK Qü • Stofe cf rights surftet famiged
♦ Sfefe ofügtt ä*H»cfr: OK
Sim (3.2) “ 1/20 * ( 6*0.8 + 1*0.8 + 1*0.4 + 6*0.95 + ố* 0.0) -D.585
b) r in h độ ù iơ n g tự g iũ a ca ¡ập lu ậ n m ớ i và ca lậ p lu ậ n CASE 2.
Hình 3.3: Quá trình tính độ tương tự giữa các ca lập luận.
Như vậy, CASE 1 là ca lập luận tương tự nhất với bài toán mới.
Từ ví dụ trên ta cũng thấy ràng, độ tương tự giữa các ca lập luận phụ thuộc rất lớn vào bộ trọng số đưa ra cho các thuộc tính đặc tà ca lập luận (ờ ví dụ trẽn bộ trọng số này là 6, 1, 1, 6, 6 íưcmg ứng với các thuộc tính Problem, Car, Year, Battery voltage, State o f light) vì nếu thay đổi bộ trọng sổ này đi thi kết quả độ tương tự sẽ sai khác rất nhiều. Vậy, các trọng số được đưa ra như thế nào? Câu trả lời ở đây là bộ trọng sổ được các chuyên gia bài toán
Tính độ tưong tự và ímg dụng trong CBR 1 /1 /2 0 0 6
đưa ra trên cơ sờ đánh giá mức độ quan trọng của từng thuộc tính trong miền bài toán. Tuy nhiên, các trọng số này thường không đáp ứng được tốt nhất theo ý chuyên eia bời nhiều khi có hai ca lập luận mà chuyên gia cho là khá giống nhau nhưng khi áp dụng bộ trọng sổ này vào hàm tinh độ tương tự thi kết quả lại không được giống lẳm ...D o vậy, bài toán cần giải quyết trong chương này là tìm ra được bộ trọng số cho hàm tính độ tương tự để thể
hiện “giống nhất” sự đánh giá của chuyên gia, đây là một vẩn đề cấp thiết
trong việc xây dựng và tổi ưu các hệ thống CBR.
Trước yêu cầu của bài toán này, chúng tôi đề xuất một phương pháp tổi ưu bộ Ưọng số trong CBR dựa trên tập ca lập luận và ý kiến đánh giá chung của các chuyên gia về độ tương tự giữa các ca lập luận. Tư tường cơ bản của phưcmg pháp này là xây dựng một hàm mục tiêu để đánh giá độ chinh xác của hàm tính độ tương tự trên tập ca ỉập luận so với đánh giá của các chuyên gia, sau đó sử dụng các phương pháp toán học để tối ưu hàm này. Có nhiều phương pháp khác nhau để tổi ưu một hàm số, trong bài này chúng tôi lựa chọn hai phương pháp là gradient và giải thuật di truyền [24],
3.2 C á c phương pháp tính độ tương tự giữa các ca lậpluận trong C B R