Hӑc giám sát suӕ Wÿ ӡi

Một phần của tài liệu (Luận văn thạc sĩ) nhận dạng thực thể định danh từ văn bản ngắn tiếng việt và đánh giá thực nghiệm luận văn ths máy tính 84801 (Trang 28 - 30)

DӵDWUrQÿӏQKQJKƭDFKXQJFӫa LML ӣ phҫQ7DFyÿӏQKQJKƭD+ӑc giám sát suӕWÿӡLQKѭVDX

ĈӏQKQJKƭD [21]: Hӑc giám sát suӕWÿӡi là mӝt quá trình hӑc liên tөc mà bӝ hӑFÿm thӵc hiӋn mӝt chuӛi các bài tốn hӑc giám sát ܶଵ, ܶଶ«ܶே, và giӳ lҥi tri thӭFÿmKӑFÿѭӧc WURQJFѫVӣ tri thӭc (KB). Khi mӝt bài tốn mӟi ܶேାଵÿӃn, bӝ hӑc sӱ dөng tri thӭc quá khӭ WURQJ.%ÿӇ giúp hӑc mӝt mơ hình mӟi ݂ேାଵ tӯ dӳ liӋu huҩn luyӋn ܦேାଵ cӫa ܶேାଵ. Sau khi hӑcܶேାଵ.%FNJQJÿѭӧc cұp nhұt các tri thӭFÿmKӑFÿѭӧc tӯ ܶேାଵ.

Hӑc giám sát suӕW ÿӡi bҳW ÿҫu tӯ bài báo cӫa Thrun [14] vӟL ÿӅ xuҩt mӝt vài SKѭѫQJSKiS/0/EDQÿҫu trong ngӳ cҧnh hӑc theo ghi nhӟ (memory-based learning) và

mҥQJ Qѫ-ron. Cách tiӃp cұn mҥQJ Qѫ-URQ ÿm ÿѭӧc Silver và cӝng sӵ cҧi tiӃQ QăP 2015[15]. Trong các bài báo này, mӛi bài tốn mӟi tұp trung vào viӋc hӑc mӝt khái niӋm

hoһc lӟp mӟi. Mөc tiêu cӫa LML là tұn dөng các dӳ liӋu trong quá khӭ ÿӇ giúp xây dӵng mӝt phân lӟp nhӏ SKkQÿӇ [iFÿӏnh các thӇ hiӋn cӫa lӟp mӟi này. Trong cơng trình cӫa Fei và cӝng sӵ [7], mӝt hình thӭFÿһc biӋt cӫD/0/ÿѭӧc gӑi là hӑc tích luӻ ÿѭӧFÿӅ xuҩt. 7ѭѫQJWӵ QKѭFiFF{QJWUuQKWUrQPӛi bài tốn mӟLÿѭӧc trình bày vӟi mӝt lӟp dӳ liӋu

mӟi cҫn phҧi hӑFÿѭӧc. Tuy nhiên, khơng giӕQJQKѭFiFF{QJWUuQKWUrQKӋ thӕng chӍ duy trì mӝt mơ hình phân lӟSÿDOӟp duy nhҩt ӣ mӑi thӡLÿLӇm. Khi mӝt lӟp mӟi xҧ\ÿӃn, mơ

KuQKÿѭӧc cұp nhұWÿӇ phân lӟp tҩt cҧ các lӟp quá khӭ và lӟp mӟi. Vì vұy hình thӭc hӑc

này cĩ tên gӑi là hӑFWtFKONJ\1KyPWiFJLҧ Fei và cӝng sӵ [7@FNJQJÿӅ xuҩt mӝWSKѭѫQJ pháp hӑc dӵD WUrQ NK{QJ JLDQ WѭѫQJ Wӵ ÿӇ phát hiӋn các lӟp mӟL FKѭD ÿѭӧc nhìn thҩy

trong quá trình huҩn luyӋn. Ruvolo và EatRQ ÿӅ xuҩt thuұt tốn ELLA cҧi tiӃQSKѭѫQJ pháp hӑFÿDQKLӋm GO-MTL [10@ÿӇ làm cho nĩ trӣ thành mӝWSKѭѫQJSKiS +ӑc suӕt ÿӡi. Chen và cӝng sӵ [14@ ÿӅ xuҩt thêm mӝt kӻ thuұt trong ngӳ cҧnh phân lӟp Nạve

Bayesian.

2.7 Áp dөng hӑc suӕWÿӡi vào mơ hình trѭӡng ngүXQKLrQFyÿLӅu kiӋn

1Kѭÿmÿѭӧc trình bày ӣ phҫn trên, chúng ta khơng thӇ WKD\ÿәLP{KuQKNKLQyÿm ÿѭӧc xây dӵng và áp dөQJÿӕi vӟi hӑc máy giám sát. Vұ\OjPFiFKQjRÿӇ chúng ta cĩ

21

é Wѭӣng chính cӫD SKѭѫQJ SKiS Qj\ Oj FK~QJ WD VӁ tұp trung khai phá các mӕi quan hӋ phө thuӝc hay các mүu phө thuӝc trong quá trình áp dөng mơ hình CRFs cho mӝt

miӅn mӟi. Thӵc thӇ sӁ ÿѭӧc gán mӝt nhãn tri thӭFOj³$´ÿӇ ÿiQK Gҩu là mӝt thӵc thӇ

tiӅm QăQJQӃXQKѭWKӵc thӇ ӣ cùng mүu quan hӋ phө thuӝc vӟi nĩ xuҩt hiӋQWURQJFѫVӣ tri thӭFYjÿѭӧFJiQQKmQOj³2´FKRWUѭӡng hӧSQJѭӧc lҥi. Thuӝc tính phө thuӝc tәng quát

(Label-G) là mӝt trong hai loҥi thuӝc trính trҥng thái (Lable-:RUOGÿѭӧc sӱ dөng trong mơ hình CRFs, giá trӏ cӫa thuӝFWtQKQj\ÿѭӧc khӣi tҥo tӯ các mӕi quan hӋ phө thuӝc.

1KѭYұy, các mӕi quan hӋ phө thuӝc vӟi các nhãn tri thӭF³$´KRһF³2´FKtQKOjFҫu nӕi giӳa mơ hình và dӳ liӋXJL~SWăQJKLӋu suҩt cӫa viêc nhұn dҥng thӵc thӇ mà khơng cҫn

phҧLWKD\ÿәi mơ hình sҹn cĩ.

Chi tiӃt vӅ SKѭѫQJSKiSiSGөng hӑc suӕWÿӡLYjRP{KuQK&5)VFNJQJQKѭFiFK xây dӵng các mүu phө thuӝc dӵDYjRFѫVӣ tri thӭc sӁ ÿѭӧc trình bày ӣ FKѭѫQJ

Tәng kӃWFKѭѫQJ

&KѭѫQJQj\ÿmJLӟi thiӋu khái niӋm mơ hình WUѭӡng ngүXQKLrQFyÿLӅu kiӋQѭӟc

Oѭӧng tham sӕ FKRP{KuQKFNJQJQKѭEjLWRiQJiQQKmQFKRGӳ liӋu dҥng chuӛi. Bên cҥnh ÿyFKѭѫQJQj\FNJQJnhӳng kiӃn thӭFFѫEҧn nhҩt vӅ hӑc suӕWÿӡi bao gӗPÿӏQKQJKƭDYӅ

hӑc suӕWÿӡi, kiӃn trúc cӫa mơ hình hӑc suӕWÿӡi và nhӳng chi tiӃt các thành phҫn cӫa kiӃn trúc, cách ÿiQKJLiEjLWRiQiSGөng mơ hình hӑc suӕWÿӡi, trình bày tәng quát vӅ êWѭӣng

nhҵm áp dөng hӑc suӕWÿӡLÿӇ nâng cao hiӋu quҧ cӫa mơ hình mà khơng cҫn phҧLWKD\ÿәi mơ hình sҹn cĩ&KѭѫQJVDXluұQYăQ sӁ trình bày chi tiӃt vӅ vҩQÿӅ áp dөng hӑc suӕWÿӡi

22

&KѭѫQJ0{KuQKKӑFVXӕWÿӡLiSGөQJYjREjLWRiQQKұQ GҥQJWKӵFWKӇ

&KѭѫQJQj\luұQYăQ sӁ giӟi thiӋu vӅ viӋc áp dөng mơ hình hӑc suӕWÿӡi áp dөng vào bài tốn nhұn dҥng thӵc thӇ, cө thӇ là áp dөng kӃt hӧp vӟi mơ hình CRF. Nӝi dung cӫDFKѭѫQJVӁ nhҩn mҥnh vӅ vҩQÿӅ kӃt quҧ cӫa CRFs sӁ ÿѭӧc cҧi thiӋn bҵng cách sӱ dөng các tri thӭF WUѭӟF ÿy Wӯ các kӃt quҧ nhұQ ÿѭӧc khi áp dөng cho các miӅn khác. 7Uѭӟc hӃt luұQYăQ trình bày vӅ mүu phө thuӝc ± ³FKuDNKyD´FKRYLӋc nâng cao hiӋu quҧ cӫa mơ hình CRFs áp dөng hӑc chuyӇQÿәi.

Một phần của tài liệu (Luận văn thạc sĩ) nhận dạng thực thể định danh từ văn bản ngắn tiếng việt và đánh giá thực nghiệm luận văn ths máy tính 84801 (Trang 28 - 30)

Tải bản đầy đủ (PDF)

(47 trang)