Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Intelligens adatelemzés és döntéstámogatás

    A tantárgy angol neve: Intelligent Data Analysis and Decision Support

    Adatlap utolsó módosítása: 2023. január 4.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar
    Mérnökinformatikus mesterképzés (MSc)
    Adattudomány és mesterséges intelligencia főspec.
    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIMB09   2/1/0/v 5  
    3. A tantárgyfelelős személy és tanszék dr. Antal Péter,
    A tantárgy tanszéki weboldala https://www.mit.bme.hu/oktatas/targyak/vimimb09
    4. A tantárgy előadója

    Dr. Antal Péter docens, MIT

    Dr. Szűcs Gábor docens, TMIT
    5. A tantárgy az alábbi témakörök ismeretére épít Adatelemzés, gépi tanulás, mesterséges intelligencia alapjai
    6. Előtanulmányi rend
    Ajánlott:
    Matematikai statisztika
    7. A tantárgy célkitűzése

    Az intelligens adatelemzés és döntéstámogatás tárgy haladó, a gépi tanulás és mélytanulás kutatási frontvonalában lévő megközelítéseket mutat be, így segítve valós problémák szélesebb körének mérnöki megoldását. Elsőként áttekintjük a bayes statisztikai és döntéselméleti kereteket, amelyek egységes keretet nyújtanak a háttértudás felhasználásához, a hiányos és bizonytalan adatok kezeléséhez, komplex modellek alkalmazásához és az intelligens következtetési formákhoz, adaptív adatgyűjtéshez.

    Intelligens adatelemzési módszerek között bemutatjuk azokat a technikákat, melyek előfeldolgozásként segíthetnek az elemzés hatékonyságán, jóságán. Ezek között a dimenziócsökkentési és reprezentáció tanulási módszerek a hatékonyságot növelik - az utóbbiak absztraktabb megoldást nyújtva - a klaszterezés pedig fontos része az adatelemzés folyamatának. Az adatelemzést segítő gépi tanuló módszerek teljesítményének növelése történhet együttes gépi tanuló módszerekkel, ezen kívül valós teszthalmazon robusztusabb teljesítmény érhető el regularizációval. Részletesen ismertetjük az adatvezérelt döntéstámogatást ezekkel a gépi tanuló módszerekkel és a döntések kiértékelésének folyamatát, valamint gyakorlatban bemutatjuk ezek használatát különböző típusú (egyszerű, hierarchikus, idősoros, strukturálatlan) adatokon.

    A beavatkozási adatok kezelésére és az intelligens adatgyűjtés támogatására bemutatjuk a valószínűségi gráfos modellosztályt és a kapcsolódó döntési hálókat és oksági hálókat, valamint a valószínűségi, oksági és kontrafaktuális következtetési módokat. Ismertetjük a bayes következtetések közelítő számítási módszereit, elsősorban a Markov lánc Monte Carlo módszereket. Bemutatjuk az oksági modellek modern gépi tanulási módszereit és a háttértudás szerepét a tanulásban, adat- és tudásfúzióban. Az adaptív adatgyűjtés keretén belül bemutatjuk az aktív tanulást, a megerősítéses tanulást és a k-karú rablókat, valamint ezek alkalmazását ajánló rendszerekben és felfedező rendszerekben.

    8. A tantárgy részletes tematikája

    Az előadások részletes tematikája:

    1. Becslés és döntéselmélet, az optimális döntés és az emberi döntések sajátosságai, hasznosságfüggvények típusai. Intelligens következtetési típusok: valószínűségi, oksági és kontrafaktuális következtetés. Az információ értéke és optimális információgyűjtési stratégiák.
    2. Intelligens adatelemzési módszerek, adatelemzés különböző típusú (táblázatos, idősoros, strukturálatlan) adatokon.
    3. Regresszió típusú döntési problémák. Regularizált regressziós módszerek: Ridge, Lasso, Elastic net.
    4. Nem lineáris dimenziócsökkentő metódusok (autoencoder, manifold). Dimenzióredukció alkalmazási területei.
    5. Klaszterezés csoportosítási feladatoknál és osztályozási problémák előfeldolgozásaként. Biklaszterezés, spektrál klaszterező módszerek.
    6. ML módszerek teljesítményének (pontosságának) növelése. Együttes gépi tanuló módszerek (ensemble, ECOC).
    7. Ajánlórendszerek típusai és adatelemző módszerei. Mátrix faktorizáció és kollaboratív szűrés az ajánlórendszereknél.
    8. Adatvezérelt döntéstámogatás gépi tanuló modellekkel. Döntések kiértékelésének folyamata.
    9. Valószínűségi gráfos modellek definíciói, parametrikus és strukturális szemantikája, ritka  reprezentációk használata, következtetési algoritmusok, nevezetes modellosztályok (naív Bayes hálók, Rejtett Markov Modellek). Kiterjesztések elsőrendű valószínűségi logikák és sztochasztikus nyelvtanok irányába.
    10. Oksági modellek származtatása, megfigyelési ekvivalencia fogalma. Beavatkozások modellezése a do(.) szemantika és gráf csonkolás segítségével. Korrigálás fogalma oksági hatáserősség becslésében. Kontrafaktuális következtetés.
    11. Konjugáltság és elégséges statisztika egzakt Bayes következtetésben.  Bayes következtetések közelítési módszerei. Monte Carlo módszerek, elutasításos és fontossági mintavételezés. Markov Lánc Monte Carlo módszerek (MLMC): konvergencia és konfidencia diagnosztikai, többláncú módszerek, Metropolis-kapcsolt MLMC. Hibrid MLMC.
    12. Oksági modellek tanulása megfigyelési és beavatkozási adatból.  Tanulás háttértudással, adat- és tudásfúzió rendszermodellek tanulásánál. Modelltulajdonságok Bayes tanulása.
    13. Aktív tanulás, tanulás költséggel. k-karú rablók (banditák), Monte Carlo fakeresés. Megerősítéses tanulás, mély megerősítéses tanulás.
    14. Ajánló rendszerek, zaj és informatív hiányzás kezelése. Felfedező rendszerek, korai felfedezési teljesítménymértékek, kísérlet várható hasznossága, adaptív kísérlettervezés.

     A gyakorlatok részletes tematikája:

    1. Döntési modell konstruálása. Optimális döntés és információ értékének vizsgálata.
    2. Haladó regressziós gyakorlat Pythonban
    3. Spektrál klaszterezés képeken (Python)
    4. Együttes gépi tanuló módszerek (számolási gyakorlat)
    5. Oksági modell konstruálása. Valószínűségi, oksági és kontrafaktuális következtetés vizsgálata.
    6. Markov Lánc Monte Carlo módszerek vizsgálata: Gibbs  és hibrid MCMC mintavételezés.
    7. Hiperparaméter optimalizálás k-karú rablók és mély tanulásos Monte Carlo fakereséssel.

     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás és gyakorlat.
    10. Követelmények

    Szorgalmi időszakban:

    Hat darab kéthetenkénti kis házi feladat, amelyek mindegyikének megfelelő szintű megoldása az aláírás feltétele. Egy opcionális nagy házi feladat, melyeket a hallgatóknak az oktatókkal egyeztetett témában és adatkészleten kell elvégezni. Aki a nagy házi feladatot magas színvonalon elvégzi, annak az oktatók megajánlott jegyet ajánlhatnak fel.

    Vizsgaidőszakban:

    Írásbeli vizsga, mely kiterjed a lefedett elméleti és gyakorlati anyagokra, kapcsolódva a házi feladatokhoz. A vizsga elégséges szintje 40%.

    11. Pótlási lehetőségek Két kis házi feladat és a nagy házi feladat a pótlási hét végéig pótolható.
    12. Konzultációs lehetőségek Konzultáció előzetes egyeztetés szerint érhető el.
    13. Jegyzet, tankönyv, felhasználható irodalom
    • Russell, Stuart J., Peter Norvig: Artificial intelligence a modern approach. Pearson Education, Inc., 2010.
    • Antal Péter - Antos András - Hajós Gergely - Hullám Gábor - Millinghoffer András, Antal Péter (szerk.), Valószínűségi döntéstámogató rendszerek, ISBN: 978-963-2791-84-5, 2014
    • Antal Péter - Antos András - Horváth Gábor - Hullám Gábor - Kocsis Imre - Marx Péter - Millinghoffer András - Pataricza András - Salánki Ágnes, Antal Péter (szerk.), Intelligens adatelemzés, ISBN: 978-963-2791-71-5, 2014
    • Thomas A. Runkler: Data Analytics - Models and Algorithms for Intelligent Data Analysis, 2nd Edition, Springer, 2016
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra42
    Félévközi készülés órákra28
    Felkészülés zárthelyire 
    Házi feladat elkészítése40
    Kijelölt írásos tananyag elsajátítása 
    Vizsgafelkészülés40
    Összesen150
    15. A tantárgy tematikáját kidolgozta

    Dr. Szűcs Gábor docens, TMIT

    Dr. Antal Péter docens, MIT