Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Adatelemzés mélytanulási módszerekkel

    A tantárgy angol neve: Data Analysis with Deep Learning Methods

    Adatlap utolsó módosítása: 2023. április 18.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar
    BSc, mérnökinformatikus, specializáció
    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VITMAC15 5 2/2/0/v 5  
    3. A tantárgyfelelős személy és tanszék Dr. Papp Dávid,
    4. A tantárgy előadója Dr. Mihajlik Péter, egyetemi adjunktus, TMIT
    Dr. Papp Dávid, egyetemi adjunktus, TMIT
    Dr. Szűcs Gábor, egyetemi docens, TMIT
    5. A tantárgy az alábbi témakörök ismeretére épít Alapvető matematikai és algoritmuselméleti ismeretek
    7. A tantárgy célkitűzése A tárgy célkitűzése az adatelemzéshez szükséges gépi tanulás és azon belül a mélytanulás módszereinek oktatása, amelyek segítségével az intelligens rendszerek képesek akár az emberi képességet is meghaladó módon megtanulni az adatokban rejlő összefüggéseket, mintázatokat, jellegzetességeket. A tárgy során ismertetett módszereket strukturált gazdasági adatok előrejelzésén és strukturálatlan multimédia tartalmak elemzésén keresztül tekintjük át, így a hallgatók részletesen megismerkedhetnek az ezekhez szükséges gépi tanuló módszerek széles spektrumával, az információs rendszerek adattípusainak megfelelő specialitásokkal, munkafolyamattal, részfeladatokkal. Az adattípusok közül napjaink média-intenzív világában általánossá váltak a heterogén, zajos és hiányos multimédia tartalmak, melyek gépi tanításához mély neurális hálók szükségesek, így a tantárgy egy részletes, átívelő képet nyújt az intelligens adatelemzéstől a mélytanulásig.
    8. A tantárgy részletes tematikája Az előadások részletes tematikája:

    • Adatelemzési problémák típusai. Adatelőkészítési és gépi tanuló módszerek az adatelemzés folyamatában.
    • Bináris és többosztályos osztályozás. Döntési felületek meghatározása. Szupport vektor gépek, one-vs-all algoritmus, keresztvalidáció.
    • Magyarázható gépi tanuló módszerek. Lusta tanuló módszerek. K-legközelebbi szomszéd módszer.
    • Lineáris modellek. Linear discriminant analysis (LDA).
    • Klaszterezés, k-means (Forgy módszer), k-means++ algoritmus. Belső és külső kiértékelési indikátorok, klaszteranalízis. Hierarchikus klaszterezés. Sűrűség alapú klaszterezés (pl. DBSCAN).
    • Dimenziócsökkentés szerepe az adatok elemzésében. Legfontosabb dimenziócsökkentő módszerek.
    • Mélytanulás, mély neurális hálózatok (DNN). Aktivációs és veszteség függvények. Neurális hálózat tanítása, hiba visszaterjesztés. Túltanulás elleni regularizáció (early stopping, dropout, batch normalizálás). Optimalizációs eljárások, hiperparaméter optimalizálás.
    • DNN típusok: Konvolúciós neurális hálózatok (CNN), Rekurrens neurális hálózatok (RNN), Gated Recurrent Unit (GRU), Long Short-Term Memory (LSTM) és Bidirectional RNN (BRNN).
    • Adatelemzés strukturált és strukturálatlan vállalati adatokon. Szöveges adatállományok. Vállalati adatok osztályozása és szegmentálása.
    • Idősor jellegű adatok specialitásai. Idősor analízis. Gazdasági adatok elemzése, előrejelzési módszerek.
    • Idősor analízis mélytanulási módszerekkel. Sequence-to-sequence módszerek.
    • Multimédia elemzés, mélytanulás az audio jellegű adatok osztályozásához.
    • Videóelemzés. Objektumkövetés videókban. Tracking-by-detection megközelítés. Egyszerű IOU alapú követés, pozícióbecslési eljárások, Kálmán szűrő. Multiple Object Tracking (MOT). Simple Online and Realtime Tracking (SORT) és DeepSORT algoritmus.
    • Osztályozás kevés adat alapján. Zero-shot, one-shot, few-shot tanulás, sziámi hálózatok. Megtévesztési módszerek. Face spoofing, deep fake.

    A gyakorlatok/laborok részletes tematikája:

    A félév során a gyakorlatok Python környezetben történnek, amelyek mindig az előadás anyaghoz kapcsolódnak és az ismeretek elmélyítését szolgálják.

    • Python alapok (ipython notebook, numpy, scikit-learn). Adatelőkészítési lépések a gyakorlatban.
    • Modell validáció és jellemzőtervezés. KNN és SVM összevetése.
    • K-means és hierarchikus klaszterezés vállalati adatokon. Klaszterszám meghatározása.
    • Dimenziócsökkentés a gyakorlatban.
    • Neurális hálózat implementációja.
    • Mélytanulási keretrendszerek. Konvolúciós réteg implementációja.
    • Python OpenCV programkönyvtár.
    • Osztályozás lineáris modellekel.
    • Idősor analízis. Makrogazdasági adatok elemzése.
    • Szöveges adatok elemzése.
    • Beszédfelismerés.
    • Közlekedési adatok elemzése.
    • Gépjárművek követése IOU tracker és SORT segítségével, YOLO alapon.
    • Házi feladatok bemutatása és megbeszélése.

     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Heti 2 óra előadás, 2 óra gyakorlat
    10. Követelmények Szorgalmi időszakban: 1 db zárthelyi és 1 db (opcionális) nagyházi. Az aláírás feltétele a zárthelyi dolgozat legalább elégséges szintre történő megírása. A félévközi eredmények alapján megajánlott jegy szerezhető, amely a zárthelyi és a szorgalmi nagyházi feladat osztályzatainak átlaga, amennyiben ez minimum 4-es osztályzatot jelent.
    Vizsgaidőszakban: Írásbeli vizsga
    11. Pótlási lehetőségek A zárthelyi pótlására a szorgalmi időszakban egy lehetőséget biztosítunk. Azok számára, akiknek nem sikerült sem a zárthelyi, sem a pótzárthelyi: a pótlási időszakban 1 alkalmat biztosítunk egy újabb zárthelyi dolgozatra. Az aláírás feltétele valamelyik zárthelyi (első vagy a pót- vagy a pótpót-zárthelyi) legalább elégséges szintre történő megírása.
    12. Konzultációs lehetőségek A tárgy előadójával személyesen, vagy e-mailben egyeztetett időpontban.
    13. Jegyzet, tankönyv, felhasználható irodalom • Thomas A. Runkler: Data Analytics - Models and Algorithms for Intelligent Data Analysis, 2nd Edition, Springer, 2016.
    • Charu C. Aggarwal: Neural networks and Deep Learning, Springer, 2018.
    • Andrew Ng: Deep Learning Tutorial, Stanford University, 2016.
    • François Chollet: Deep Learning with Python (Second Edition), Manning, 2021.
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra56
    Félévközi készülés órákra24
    Felkészülés zárthelyire30
    Házi feladat elkészítése-
    Kijelölt írásos tananyag elsajátítása0
    Vizsgafelkészülés40
    Összesen150
    15. A tantárgy tematikáját kidolgozta Dr. Papp Dávid, egyetemi adjunktus, TMIT
    Dr. Szűcs Gábor, egyetemi docens, TMIT
    IMSc tematika és módszer Az IMSc képzésben részt vevő hallgatóknak lehetőséget biztosítunk a tananyag magasabb szinten történő elsajátítására és mélyebb megértésére. Ezt a gyakorlati alkalmak során kiadott kiegészítő feladatok biztosítják, melyek gondolkodtató, nagyobb rutint és több gyakorlást igénylő feladatok, valamint mélyebb ismeretanyag elsajátítását igénylik.
    IMSc pontozás A gyakorlatok során a kiadott feladatokra készített megoldásokat IMSc pontokkal jutalmazzuk. Feladatonként 3 pont, a gyakorlatokon összesen 15 szerezhető.
    A vizsgán további 10 IMSc pont szerezhető a kijelölt feladat megoldásával, amennyiben a dolgozat meghaladja a 85%-os szintet. Megajánlott jegy szerzése esetén a vizsgán szerezhető 10 pontot az opcionális nagyházi feladat megoldásával lehet megszerezni, amennyiben az megfelelő komplexitású és a dokumentáció a szakirodalomban megszokott formázási követelményeket követi.
    A tárgyon maximum 25 IMSc pont szerezhető.