Pastiprinimu paremto agento gebėjimas mokytis ir perkelti išmoktą pasaulio modelį į kitas pasiekiamas deterministines iš laukelių sudarytas aplinkas
|
Title | Pastiprinimu paremto agento gebėjimas mokytis ir perkelti išmoktą pasaulio modelį į kitas pasiekiamas deterministines iš laukelių sudarytas aplinkas |
Authors | |
Abstract | Pastiprinimu paremti agentai mokytis susiduria su problemomis perkeldami vienoje aplinkoje įgytas žinias į naujasaplinkas: taip nutinka dėl receptorių pateikimų interpretavimo būdo ir mechanizmų, leidžiančių tinkamai apibendrinti receptoriųpateikimus, trūkumo. Straipsnyje ši žinių perkeliamumo problema yra sprendžiama pasiūlius agentą, kuris taiko sprendimųmedžio indukcijos ir konstrukcinės indukcijos metodus, o receptorių pateikimus interpretuoja kaip paskirstytą savybių rinkinį.Pradėdamas darbą agentas neturi jokių žinių nei apie aplinką, nei apie savo veiksmų pasekmes. Jis išmoksta pasaulio modelį(sprendimų medžių rinkinį), atitinkantį išsamius veiksmų aprašymus, pagal kurį turint konkrečius receptorių pateikimus, galimaprognozuoti veiksmų pasekmes. Agento planavimo komponentė, paremta paieškos platyn metodu: ji ieško veiksmų grandiniųnuo vienos aplinkos situacijos iki kitos naudodama pasaulio modelį ir pagal jį suprognozuotus receptorių pateikimus. Pasiūlytasmetodas palygintas su Q-mokymo ir Adaptyvaus dinaminio programavimo metodais: pateiktos metodų galimybės siekti tikslųstatinėse stebimose deterministinėse iš laukelių sudarytose aplinkose, taikant ne toje pačioje aplinkoje išmoktus pasauliomodelius.DOI: http://dx.doi.org/10.5755/j01.itc.41.4.915 |
Publisher | Kaunas University of Technology |
Date | 2012-11-20 |
Source | Informacinės technologijos ir valdymas Vol 41, No 4 (2012) |
Rights | Copyright terms are indicated in the Republic of Lithuania Law on Copyright and Related Rights, Articles 4-37. |