Belépés címtáras azonosítással
magyar nyelvű adatlap
Kooperatív és tanuló rendszerek
A tantárgy angol neve: Co-operative and Learning Systems
Adatlap utolsó módosítása: 2007. szeptember 25.
Műszaki Informatika Szak
Autonóm intelligens rendszerek szakirány
Dr. Dobrowiecki Tadeusz, egyetemi docens
Dr. Horváth Gábor, egyetemi docens
Méréstechnika és Információs Rendszerek Tanszék
mesterséges intelligencia, programozási ismeretek (Java)
A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.
A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.
mesterséges intelligencia
Az informatikai szolgáltatások és alkalmazások egyre nagyobb hányadában vezet sikerre a több ágensből álló elosztott rendszerek koncepciója, tehát olyan rendszereké, ahol autonóm és feltehetően intelligens ágensek egy közös környezetbe vannak beágyazva és egymásra vannak utalva. Ez különösképpen igaz az ambiens intelligens információtereket megvalósító intelligens beágyazott rendszerekre, az elosztott intelligens szenzor rendszerekre, a szemantikus webre, az emberi szervezetek működését támogató elosztott döntéstámogató rendszerekre, és sok másra. Ágensek közös környezetben való működése potenciális előnyök, de egyben problémák forrása is, hiszen az autonóm ágensek képesek egymást segíteni, de megzavarni is. Az elosztott ágensrendszer nyújtotta emelt szolgáltatások kialakításában számos mechanizmusnak van szerepe, a tárgyban ezek közül a két legfontosabbat emeljük ki bemutatva az összefonódásukat is. Ezek a kapcsolattartásból kialakuló együttműködés és a nem tökéletes tudást kompenzálni képes tanulás.
A tárgy célja megismertetni a hallgatókat a gépi rendszerek együttműködésének problematikájával, az intelligens kapcsolattartás és együttműködés gyakorlati módszereivel és eszközeivel és ezt követően a gépi tanulás olyan problémáival, speciális vonásaival és rejtett lehetőségeivel, amelyek csak több intelligens rendszer környezetében alakulhatnak ki.
I. Több ágensből álló elosztott rendszerek (3 hét)
Elmélet: A nyílt rendszer fogalma és jelentősége, informatikai szabványosítás.
Az ágens rendszer fogalma, az ágens alapú rendszerek tulajdonságai. Multi-ágens rendszerek. A kommunikáció és a kooperáció alapfogalmai.
Ágens szervezetek, FIPA kezdeményezés és a Jade ágensközösség felépítése.
Az együttműködés informatikai alapjai. Az ágens kommunikáció természetes nyelvű elemei és az erre alapozó protokollok. Jade ágensek fejlesztése.
Gyakorlat: Kisérletezés Jade platformon az előrekészített ágensekkel.
II. Együttműködés konfliktusok mellett (3 hét)
Elmélet: Együttműködési formák elemzése és megvalósítása elosztott rendszerekben. Az alapvető együttműködési protokollok (vállalkozási hálók, aukciók, ...).
Konfliktuskezelés ágens környezetben, konfliktusok felszámolása kommunikációval és protokollal, együttműködést támogató ágens közösség nyelvek. Az együttműködés területei.
Megvalósítás szintű architektúrális kérdések, az ágens rendszerek mobilitási és biztonsági kérdései.
Gyakorlat (HF1): Kisebb méretű problémát kooperatív módon megoldó ágensteamek tervezése, implementálása és validálása Jade platformon.
III. Tanulás ágensszervezetben (6 hét)
Elmélet: Tanulás formái, ellenőrzött, nemellenőrzött megerősítéses tanulás (áttekintés).
A megerősítéses tanulás, mint a multiágens rendszerek alapvető tanulási eljárása. A megerősítéses tanulás elemei és eljárásai. Célok és jutalmak. Markov tulajdonság. Markov döntési folyamat. Értékfüggvény. Q-tanulás, Időbeli különbség (TD) tanulás. A cselekvés–értékfüggvény tanulása.
Tanulás kooperatív rendszerekben. Kooperatív hierarchikus megerősítéses tanulás. A játékelmélet alapjai. Kétszemélyes és többszereplős játékok. Optimális stratégiák és tanulásuk. Sztochasztikus játékok, tanulás sztochasztikus játékokban. Tanulás hatékonyságának fokozása együttműködéssel (elosztott induktív tanulás).Együttműködés hatékonyságának fokozása tanulással (csapatszerep tanulása). Tanulás dinamikus rendszerekben. A mozgócél tanulás problémája.
Gyakorlat (HF2): Kialakított kooperatív ágensek kibővítése tanulási képességekkel, a feladatuk jellegének megfelelően. Kísérletezés egyéni ágens szintjén.
IV. Esettanulmányok és gyakorlati kísérletek (2 hét)
Elmélet: Esettanulmányok és gyakorlati kísérletek. Alkalmazás elosztott web rendszerekben. Tanulás kooperatív rendszerekben: esettanulmány és példa: Robotfoci
Gyakorlat (HF3): Teljes létszámú ágensteamek demonstrációs vizsgálata kooperativitásuk és tanulékonyságuk szempontjából.
A tárgy elméleti része előadás formájában kerül leadásra. Gyakorlati kísérletezésre a házi feladatban, a félév végi előadásokon, illetve a kapcsolódó labor keretein kerül sor.
a. A szorgalmi időszakban:
félév közben (kb. 8-9. héten) egy nagy ZH (max. pontszám 60), amely a félév utolsó hetében (külön időpontban) pótolható, a szükséges minimum szint a pontok 40%-a.
egy többlépcsős kötelező házi feladat. A házi feladat lényege egy kísérleti ágensszervezet felépítése egy elképzelt alkalmazás keretein belül és az előadáson megismert együttműködési és tanulási sémák ennek segítségével történő kikisérletezése. A házi feladat bemutatása és értékelése az utolsó oktatási héten történik, egy közös nyílvános bemutató keretében. A házi feladat bemutatása vizsgaidőszakban nem lehetséges.
b. A vizsgaidőszakban:
írásbeli vizsga. A vizsgára bocsátás feltétele az évközi ZH és házi feladat minimális szintű (“megfelel”) teljesítése.
c. Elővizsga: nincs
A ZH, ill. a pótZH pótlása vizsgaidőszakban a vizsgaidőszak első három hetében egy vizsgaalkalommal a teljes vizsgaanyagból pótolható. A házi feladat vizsgaidőszakban nem pótolható.
Igény esetén, megbeszélés alapján.
A tárgy web-lapján közzétett előadási jegyzet, elektronikusan hozzáférhető ajánlott szakirodalom és kiegészítő információ, valamint web-es linkgyűjtemény.
Wooldridge, M., An Introduction to Multi-agent Systems, J. Wiley, 2002
Stuart Russell és Peter Norvig: Mesterséges intelligencia korszerű megközelítésben, 2., átdolgozott kiadás, Panem Kiadó, Budapest, 2006
Altrichter Márta, Horváth Gábor, Pataki Béla, Strausz György, Takács Gábor, Valyon József: Neurális hálózatok, Panem kiadó, 2007.
Peter Stone: Layered Learning in Multiagent Systems A Winning Approach to Robotic Soccer, MIT Press, 2000.
R. S. Sutton, A. C. Barto: Reinforcement Learning, An introduction. MIT Press, 1998.
T. Mitchell: Machine Learning, McGraw-Hill, 1997.
http://www.fipa.org The Foundation of Intelligent Physical Agents
http://www.fipa.org/resources/livesystems.html Publicly Available Agent Platform Implementations
Dobrowiecki Tadeusz
Horváth Gábor
egyetemi docens
MIT