Belépés címtáras azonosítással
magyar nyelvű adatlap
Multiágensű robotrendszerek irányítása
A tantárgy angol neve: Control of Multiagent Robotic Systems
Adatlap utolsó módosítása: 2023. január 13.
Villamosmérnöki szak, MSc képzés
Robotrendszerek mellékspecializáció
Az előadások részletes tematikája:
1. Multiágensű robotrendszerek irányításának játékelméleti alapjai véges számú stratégia esetén. (4 hét)
• Véges nulla összegű statikus és dinamikus játékok: Definíció normál és extenzív alakban. A biztonsági és nyeregponti stratégiák meghatározása tiszta, viselkedési és kevert stratégiák terében. (2 hét)
• Véges nem nulla összegű statikus és (egy- illetve többakciós) dinamikus játékok: Definíció normál és extenzív alakban. Létraszerűen egymásba ágyazott extenzív alakok kezelése. Előre eldöntött és késleltetve eldöntött Nash-egysúlyok. Információs szempontból alárendelt játékok Visszacsatolt játékok. A biztonsági, a Nash-egyensúlyi és Stackelberg-egyensúlyi stratégiák meghatározása tiszta, viselkedési és kevert stratégiák terében. (2 hét)
2. Multiágensű robotrendszerek irányításának játékelméleti alapjai végtelen számú stratégia esetén. (4 hét)
• A végtelen statikus játék definíciója. Az optimális reakciós görbék meghatározása. Stabil és robusztus egyensúly fogalma. Versengő nem versengő és patthelyzetet generáló szituációk.(1 hét)
• Optimális irányítás egy változóban: Hamilton-Jacobi-Bellman egyenlet, Pontryagin-féle maximum elv. (1 hét)
• Optimális irányítás több változóban diszkrét és folytonos időben nemkooperatív környezetben: A nyeregpont és a Nash-egyensúly származtatása a Hamilton-Jacobi-Bellman (HJB) egyenletből és a Pontryagin-féle maximum elvből. Az eredmények alkalmazása multiágensű robotrendszerre. (1 hét)
• Optimális irányítás versengő környezetben: Hamilton-Jacobi-Isaac egyenlet. Az eredmények alkalmazása multiágensű robotrendszerre. (1 hét)
3. Multiágensű robotrendszer ütközésmentes pályatervezése (2 hét): A feladat leírása, minimális tört stratégiák. Pályatervezés fix útvonalak mentén (kötöttpályás járművek), független térképek alapján (közúti járművek), Korlátozás nélkül (légiforgalom, földi járművek szabad térben)
4. Játékelméleti és mesterséges intelligencia módszerek adoptálása területbiztosítási és területfelügyeleti feladatok ellátása dinamikusan mozgó robotcsapattal (1 hét):
• A területre belépő illetéktelen behatolók felfedezése, terelése, illetve elfogása
• A területen keletkező anomáliák felfedezése járőrözéssel
• A területen mozgó, ismeretlen pozíciójú objektum megtalálása (mentési feladatok)
5. Formáció irányítási módszerek (1 hét): Mobilis robotok, földi, vízi és légi járművek formációba rendezése. Randevú problémák definíciója, lehetséges megoldási módszerei. Pályatervezési algoritmusok a randevúk meghatározásához.
6. Multiágensű robotrendszerek tanulása (1 hét): Mesterséges intelligencia módszerek (megerősítéses tanulás, mély tanulás) és játékelméleti módszerek integrálása komplex környezetben és korlátozások mellett. Multiágensű megerősítéses tanulás.
A gyakorlatok részletes tematikája:
1. Véges nulla összegű játékok nyeregpontjának számítása analitikus és numerikus módszerekkel (2 hét)
2. Véges nem nulla összegű játékok Nash-egyensúlyának és Stackelberg-egyensúlyának számítása Matlab környezetben (2 hét)
3. Dinamikus optimalizálási feladatok megoldása Pontryagin féle maximum elv és a HJB alkalmazásával (2 hét)
4. Multiágensű robotrendszerek tanulása. Területbefestés multiágensű megerősítéses tanulással Matlab Reinforcement Learning Toolbox alkalmazásával. (1 hét)