Multiágensű robotrendszerek irányítása

A tantárgy angol neve: Control of Multiagent Robotic Systems

Adatlap utolsó módosítása: 2023. január 13.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Villamosmérnöki szak, MSc képzés

Robotrendszerek mellékspecializáció 

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIIIMA22   2/1/0/v 5  
3. A tantárgyfelelős személy és tanszék Dr. Harmati István,
A tantárgy tanszéki weboldala https://edu.vik.bme.hu/
4. A tantárgy előadója Dr. habil. Harmati István, docens, Irányítástechnika és Informatika Tsz.
5. A tantárgy az alábbi témakörök ismeretére épít Matematika (Lineáris algebra, analízis), Szabályozástechnika
6. Előtanulmányi rend
Kötelező:
NEM
(TárgyEredmény( "BMEVIIIMA14", "jegy" , _ ) >= 2
VAGY
TárgyEredmény("BMEVIIIMA14", "FELVETEL", AktualisFelev()) > 0)

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.

Ajánlott:
-
7. A tantárgy célkitűzése
A tantárgy összefoglalja a korszerű multiágensű rendszereken alapuló robotrendszerek jellemzőit, tárgyalja a konfliktussal terhelt környezetben a megvalósítandó cél által generált irányításelméleti problémákat és az optimális viselkedés megvalósításához szükséges döntéshozatal játékelméleti alapjait. A tantárgy ezen kívül ismerteti multiágensű robotrendszerekhez köthető fontosabb specifikus problémákat, azok megoldási módszereit, különös tekintettel az alábbi alkalmazási területekre fókuszálva:
• Dinamikus ütközéselkerülési stratégiák, Menekülő-Üldöző problémák
• Területvédelmező és területfoglaló stratégiák
• Dinamikus területmegfigyelési és területfelügyeleti stratégiák
• Mozgó célpont felderítése, követése, terelése
• Formáció irányítás
• Randevú problémák
• Ismeretlen környezet feltérképezése, beszínezése
• Csapatjátékok
• Erőforrás optimalizálás, célpont-kijelölő stratégiák
A tantárgy hangsúlyt fektet a multiágensű rendszerek irányításában alkalmazott játékelmélet, optimális irányításelmélet és a mesterséges intelligencia módszerek közötti kapcsolat bemutatására. A tárgyalt algoritmusok lépéseinek demonstrálása Matlab programrendszerben történik.  A tantárgyat sikeresen abszolváló hallgatók közre tudnak működni multiágens robotrendszerek és mobilis robotok számítógépes irányító és navigációs rendszereinek tervezésében, a működéshez szükséges algoritmusok kifejlesztésében és megvalósításában.

8. A tantárgy részletes tematikája

Az előadások részletes tematikája:

 

1. Multiágensű robotrendszerek irányításának játékelméleti alapjai véges számú stratégia esetén. (4 hét)

• Véges nulla összegű statikus és dinamikus játékok: Definíció normál és extenzív alakban. A biztonsági és nyeregponti stratégiák meghatározása tiszta, viselkedési és kevert stratégiák terében.  (2 hét)

• Véges nem nulla összegű statikus és (egy- illetve többakciós) dinamikus játékok: Definíció normál és extenzív alakban. Létraszerűen egymásba ágyazott extenzív alakok kezelése. Előre eldöntött és késleltetve eldöntött Nash-egysúlyok. Információs szempontból alárendelt játékok Visszacsatolt játékok. A biztonsági, a Nash-egyensúlyi és Stackelberg-egyensúlyi stratégiák meghatározása tiszta, viselkedési és kevert stratégiák terében.  (2 hét)

 

2. Multiágensű robotrendszerek irányításának játékelméleti alapjai végtelen számú stratégia esetén. (4 hét)

• A végtelen statikus játék definíciója. Az optimális reakciós görbék meghatározása. Stabil és robusztus egyensúly fogalma. Versengő nem versengő és patthelyzetet generáló szituációk.(1 hét)

• Optimális irányítás egy változóban: Hamilton-Jacobi-Bellman egyenlet, Pontryagin-féle maximum elv. (1 hét)

• Optimális irányítás több változóban diszkrét és folytonos időben nemkooperatív környezetben: A nyeregpont és a Nash-egyensúly származtatása a Hamilton-Jacobi-Bellman (HJB) egyenletből és a Pontryagin-féle maximum elvből. Az eredmények alkalmazása multiágensű robotrendszerre. (1 hét)

• Optimális irányítás versengő környezetben: Hamilton-Jacobi-Isaac egyenlet. Az eredmények alkalmazása multiágensű robotrendszerre. (1 hét)

 

3. Multiágensű robotrendszer ütközésmentes pályatervezése (2 hét): A feladat leírása, minimális tört stratégiák. Pályatervezés fix útvonalak mentén (kötöttpályás járművek), független térképek alapján (közúti járművek), Korlátozás nélkül (légiforgalom, földi járművek szabad térben)

 

4. Játékelméleti és mesterséges intelligencia módszerek adoptálása területbiztosítási és területfelügyeleti feladatok ellátása dinamikusan mozgó robotcsapattal (1 hét):

• A területre belépő illetéktelen behatolók felfedezése, terelése, illetve elfogása 

• A területen keletkező anomáliák felfedezése járőrözéssel 

• A területen mozgó, ismeretlen pozíciójú objektum megtalálása (mentési feladatok) 

 

5. Formáció irányítási módszerek (1 hét): Mobilis robotok, földi, vízi és légi járművek formációba rendezése. Randevú problémák definíciója, lehetséges megoldási módszerei. Pályatervezési algoritmusok a randevúk meghatározásához.

 

6. Multiágensű robotrendszerek tanulása (1 hét): Mesterséges intelligencia módszerek (megerősítéses tanulás, mély tanulás) és játékelméleti módszerek integrálása komplex környezetben és korlátozások mellett. Multiágensű megerősítéses tanulás.

 

A gyakorlatok részletes tematikája: 

 

1. Véges nulla összegű játékok nyeregpontjának számítása analitikus és numerikus módszerekkel (2 hét) 

2. Véges nem nulla összegű játékok Nash-egyensúlyának és Stackelberg-egyensúlyának számítása Matlab környezetben (2 hét)

3. Dinamikus optimalizálási feladatok megoldása Pontryagin féle maximum elv és a HJB alkalmazásával (2 hét)

4. Multiágensű robotrendszerek tanulása. Területbefestés multiágensű megerősítéses tanulással Matlab Reinforcement Learning Toolbox alkalmazásával. (1 hét) 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)
A tárgy anyaga előadásokon és gyakorlatokon kerül bemutatásra. Az előadások és a gyakorlatok az anyag ütemében váltogatják egymást. A gyakorlatokon számítási példák és esettanulmányok formájában kerül elmélyítésre az előadásokon elhangzott elméleti tananyag.

10. Követelmények
Szorgalmi időszakban: A tananyag ismeretét a szorgalmi időszak alatt egy alkalommal írásbeli évközi összegző teljesítményérékeléssel mérjük zárthelyi formájában. Az aláírás megszerzésének feltétele a zárthelyi legalább elégséges szintű megoldása.
Vizsga időszakban: A vizsgára bocsátás feltétele az aláírás megszerzése. A vizsga írásbeli teljesítményértékelésből és az évközi teljesítményértékelésen elért eredmények beszámításából áll. Az évközi teljesítményértékelések eredményének javítására a vizsgaidőszakban nincsen mód.
A tárgyból szerzett érdemjegy 20%-ban a zárthelyin, 80%-ban a vizsgán elért eredményből (pontszámból) kerül meghatározásra.

11. Pótlási lehetőségek
A ZH a szorgalmi időszakban egy alkalommal pótolható vagy annak eredménye javítható. A ZH a pótlási héten nem pótolható. 

12. Konzultációs lehetőségek
A szorgalmi időszakban elsősorban a tárgy oktatóinak fogadóóráján, illetve igény szerint előre egyeztetett időpontban. A vizsgaidőszakban elektronikus egyeztetés után a vizsga előtti munkanapon. Az oktatók fenntartják maguknak a jogot, hogy ne válaszoljanak olyan hallgatói levelekre/üzenetekre, ahol a szükséges információ a tárgy adatlapja vagy honlapja alapján egyértelmű.

13. Jegyzet, tankönyv, felhasználható irodalom
[1] Elektronikus anyagok a kar oktatási portálján (edu.vik.bme.hu - eduID belépés szükséges )
[2]  T. Basar, G. J. Olsder Dynamic noncooperative game theory, Academic Press, Second edition, 1995
[3] S. M. LaVAlle: Planning Algorithms, Cambridge University Press, 2006
[4] S. M. LaVAlle: A game theoretc framework for robot motion planning, PhD thesis, 1995
[5] R. Isaac: Differential Games: A Mathematical Theory with Applications to Warfare and Pursuit, Control and Optimization, Dover books, 1999
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra36
Felkészülés zárthelyire20
Házi feladat elkészítése-
Kijelölt írásos tananyag elsajátítása16
Vizsgafelkészülés36
Összesen150
15. A tantárgy tematikáját kidolgozta Dr. habil. Harmati István, docens, Irányítástechnika és Informatika Tsz.