Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Megbízható mesterséges intelligencia és adatelemzés

    A tantárgy angol neve: Trustworthy AI and Data Analysis 

    Adatlap utolsó módosítása: 2023. január 4.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar
    Mérnökinformatikus mesterképzés (MSc)
    Adattudomány és mesterséges intelligencia főspec.
    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIMB10   2/1/0/v 5  
    3. A tantárgyfelelős személy és tanszék Dr. Gönczy László,
    A tantárgy tanszéki weboldala https://www.mit.bme.hu/oktatas/targyak/vimimb10
    4. A tantárgy előadója

    Dr. Gönczy László docens, MIT

    Dr. Antal Péter docens, MIT
    5. A tantárgy az alábbi témakörök ismeretére épít Alapvető statisztikai ismeretek, adatszerkezetek, algoritmusok, mesterséges intelligencia alapvető fogalmai
    6. Előtanulmányi rend
    Kötelező:
    NEM
    (TárgyEredmény( "BMEVITMMA05", "jegy" , _ ) >= 2
    VAGY
    TárgyEredmény("BMEVITMMA05", "FELVETEL", AktualisFelev()) > 0)

    A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

    A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.

    Ajánlott:
    Matematikai statisztika
    7. A tantárgy célkitűzése

    A mesterséges intelligencia, a gépi tanulás és az adatelemzés eredményei egyre elterjedtebben használtak szolgáltatásként, beépített módon komplex, mindennapi célokat megvalósító informatikai rendszerekben. Ezen informatikai rendszerek üzembiztonsága azonban jelenleg gyakran nem megoldott,  mivel helyes működésükre tipikusan nincs garancia, fejlesztési/tesztelési módszereik nem ismertek, robusztus működésük nem biztosított, és szándékos vagy véletlen bemeneti adathibák ellen nem védettek. A megbízhatóság növelésére sokrétű kutatási és szabályozási aktivitás irányul, amely új etikai, jogi, technológiai és elméleti megközelítésekhez vezetett a társadalmi szintű kockázatok kezelésére.

    A tárgy célkitűzése a megbízható adatelemzés, gépi tanulás, és mesterséges intelligencia megközelítéseinek, fogalmainak és mérnöki gyakorlatának a bemutatása. A tárgy áttekinti az intelligens algoritmusok informatikai rendszerekbe történő integrálásának kérdéseit is, műszaki jellegű feladatok adatalapú megoldásának módszereit, és ezek integrációját a fejlesztési/üzemeltetési folyamatokba.

    A tárgy bemutatja az adatelemzés és mesterséges intelligencia társadalmi szintű felhasználásának emberközpontú megközelítését, annak etikai hátterét, jogi szabályozását, szabványokban történő megjelenését, és jó mérnöki gyakorlatban való megjelenését. Mind az adatelemzés, mind az MI esetében bemutatja az értelmezhetőség, a magyarázhatóság, a tesztelhetőség és az érzékenységvizsgálat lehetőségeit és korlátait. Ismerteti az adatelemzési munkafolyamatának és egy MI szolgáltatás/termék létrehozásának az életciklusának az átfogó formalizálását, speciálisan azok blokklánc eszközökkel hitelesített dokumentálását és az eredmény auditálását.
    8. A tantárgy részletes tematikája

    Az előadások részletes tematikája:

    1. A megbízhatóság és üzembiztonság alapfogalmai és értelmezésük az adatelemzés és a mesterséges intelligencia területén. A megbízható adatelemzés és mesterséges intelligencia megközelítései, az emberközpontú mesterséges intelligencia. Az etikus adatelemzés és etikus MI etikai háttere, jogi szabályozásai, szabványosítása és jó mérnöki gyakorlatban való megjelenései.
    2. Az adat megbízhatósága/minősége. Intelligens módszerek bemenetének előállítása és ellenőrzése: Feltáró adatelemzés céljai és alkalmazása. Adatminőség mérése, adatok feldolgozása, tidy data, ETL / ELT keretrendszerek, automatizált adatfeldolgozás és -megjelenítés. Mérnöki feltételezések felhasználása adatelemzésben: oksági, időbeli és topologikus kapcsolatok figyelembevétele.
    3. Az adat megértése és magyarázhatósága adatvizualizációval: összehasonlítás, trendelemzés, kiugró értékek keresése, kapcsolatok meghatározása, csoportosítás. Vizualizáció felhasználási esetei és ezek támogató technológiái: monitorozás/dashboard, üzleti jelentés, alternatívák/hipotézisek kiértékelése, megismételhető kutatás.
    4. Adatelemzési és gépi tanulási modellek kiértékelése, tesztelése, és garantálása: teljesítménymetrikák definiálása, alternatívák kiértékelése, eredmények és paraméterezés kiértékelésének vizuális támogatása. Érzékenységvizsgálat, változók fontosságának vizsgálata.
    5. Az adatelemzés életciklusa. Felhő alapú rendszerek. Blokklánc alkalmazása adatok megosztásának folyamatában.
    6. Kvalitatív modellek használata megbízható rendszerek felépítésének és változásainak leírására. Kvalitatív modellek/modellrészletek validálása mért adatok alapján.
    7. Adat alapú modellalkotás: Folyamatbányászat (process mining) módszerei és alkalmazásai: modellalkotás, konformanciavizsgálat, logelemzés, fraud detection. Üzleti szabályrendszerek adatalapú paraméterezése, szabálybányászat.
    8. Intelligens tanuló módszerek felhasználása kritikus rendszerekben. Hibatűrő minták alkalmazása. Tesztgenerálás MI szolgáltatásokhoz.
    9. Megbízható és magyarázható mesterséges intelligencia: fekete és fehér doboz megközelítések. Valószínűségi és oksági modellek.
    10. Megbízható valószínűségi, oksági, döntéselméleti, és kontrafaktuális érvelés.
    11. Értelmezhető MI modellek a megbízható MI formalizálásában: magyarázhatóság, hasznosság, igazságosság.
    12. Fehér doboz modellek életciklusa, auditálás, modellek kiértékelése és kockázatelemzése: ALTAI megközelítés, modellek elfogadásának/átvételének folyamata, analitikus/hibrid módszerek, modelltesztelés, magyarázatgenerálás.
    13. Fekete doboz modellek magyarázhatósága,  egyszerűbb modellek származtatása
    14. Megbízható ember-gép hibrid rendszerek, „human in the loop" megközelítés, megbízható multiágens rendszerek.

    A gyakorlatok részletes tematikája:

    1. Adatminőség kiértékelése, bemeneti adatok vizsgálata/transzformálása, data profiling.
    2. Vizuális feltáró adatelemzés, automatizált vizualizáció származtatás.
    3. Folyamatbányászat alkalmazása modellalkotásban és -validációban.
    4. Tesztgenerálás AI modellek fekete doboz teszteléséhez.
    5. Modellek érzékenységvizsgálata, változók hatáserősségének vizsgálata, CP, PDP, Shapley DALEX.
    6. Értelmezhető modellek származtatása, függetlenségek és oksági relációk reprezentálása
    7. Magyarázatgenerálás módjai, logikai, valószínűségi és oksági magyarázatok generálása.
    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás és gyakorlat.
    10. Követelmények

    Szorgalmi időszakban:

    Házi feladat, melynek során a hallgatók az oktatókkal egyeztetett témában és adatkészleten kell egyéni feladatot elvégezni, melyen a pontszám 40%-át kell megszerezni az aláírás feltételeként.

    Vizsgaidőszakban:

    A hallgatók 30 fő alatti kurzus létszám esetén szóbeli, egyéb esetben írásbeli vizsgát tesznek, mely kiterjed az elméleti alapfogalmak ismeretére és azok gyakorlati alkalmazására is. A vizsgán legalább 40%-os eredményt kell elérni az elégséges osztályzathoz. A vizsga eredménye 60%-os, a házi feladat 40%-os súllyal számít bele a félév végi jegybe. 

    11. Pótlási lehetőségek A házi feladat a pótlási hét végéig pótolható.
    12. Konzultációs lehetőségek A félév során az oktatókkal egyeztetett időpontban, személyesen vagy online.
    13. Jegyzet, tankönyv, felhasználható irodalom
    • A tantárgyban kiadott elektronikus segédanyagok, fóliasorok, interaktív Jupyter Notebook jegyzetek.
    • Russell, Stuart J., Peter Norvig: Artificial intelligence a modern approach. Pearson Education, Inc., 2010.
    • Theus, Martin, and Simon Urbanek. Interactive graphics for data analysis: principles and examples. CRC Press, 2008.
    • Wickham, Hadley; Grolemund, Garrett (2017). R for Data Science : Import, Tidy, Transform, Visualize, and Model Data. Sebastopol, CA: O'Reilly Media. ISBN 978-1491910399. (elektronikusan elérhető)
    • Antal Péter (szerk.). Intelligens adatelemzés. Typotex Kiadó, 2014. Elektronikusan elérhető jegyzet.
    • Biecek, Przemyslaw, and Tomasz Burzykowski. Explanatory model analysis: Explore, explain and examine predictive models. Chapman and Hall/CRC, 2021. (elektronikusan elérhető)
    • Cristoph Molnar. Interpretable Machine Learning: A Guide For Making Black Box Models Explainable, Second Edition, 2022. (elektronikusan elérhető)
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra42
    Félévközi készülés órákra28
    Felkészülés zárthelyire 
    Házi feladat elkészítése40
    Kijelölt írásos tananyag elsajátítása 
    Vizsgafelkészülés40
    Összesen150
    15. A tantárgy tematikáját kidolgozta

    Dr. Gönczy László docens, MIT

    Dr. Antal Péter docens, MIT