Haladó adatelemzési módszerek labor

A tantárgy angol neve: Advanced Data Analysis Methods Laboratory

Adatlap utolsó módosítása: 2023. április 20.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
MSc, mérnökinformatikus, Adattudomány-és Mesterséges Intelligencia főspecializáció A2 labortárgy
Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMMB10   0/0/3/f 5  
3. A tantárgyfelelős személy és tanszék Dr. Toka László,
4. A tantárgy előadója Gyires-Tóth Bálint Pál, docens, TMIT
Orosz Péter, docens, TMIT
Bolgár Bence, adjunktus, MIT
Hadházi Dániel, doktorandusz, MIT
5. A tantárgy az alábbi témakörök ismeretére épít Adattudomány, mesterséges intelligencia, adatelemzés, statisztika, valószínűségszámítás
6. Előtanulmányi rend
Kötelező:
TárgyTeljesítve("BMEVITMMA19") VAGY
TárgyTeljesítve("BMEVITMMA06")

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.

Ajánlott:
Kötelező Mélytanulás
Ajánlott Adatbázisok, Mesterséges intelligencia
7. A tantárgy célkitűzése A tárgy célja az Adattudomány és mesterséges intelligencia specializáción szerzett elméleti ismeretek és gyakorlati képességek elmélyítése egy konkrét adatbányászati projekt végrehajtásával.
8. A tantárgy részletes tematikája Az előadások részletes tematikája:
-

A gyakorlatok, laborok részletes tematikája:

1. Az adatbányászati feladat kiválasztása és értelmezése, a projektmunka megtervezése, a majdani megoldások kiértékelésének rögzítése
A továbbiakban teljes adatbányászati ciklusok megtétele és újradefiniálása az alábbi munkaszakaszok értékelésével:
2. Adatelőkészítés (adatbázis és adatformátum kiválasztása, adattisztítás, stb.)
3. Adatvizualizáció és adatelemzés (korrelációanalízis, magyarázóváltozó-választás, adattranszformációk, stb.)
4. Gépi tanulási modellek előállítása (modellválasztás, hibrid, mélytanulás, stb.)
5. Gépi tanulási modellek értékelése (metrika-választás, bootstrapping, az eredmények javítása, hiperparaméter-hangolással, boosting alkalmazásával, stb.)
6. Az előállított adatbányászati folyamat gyakorlati alkalmazása (felhőbe történő telepítés, etikai kérdések, adatvédelem)


9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) A tematikában rögzített mérföldkövekhez tartozó programozási feladatok önálló megoldása házi feladatként, a megoldások bemutatásával a laboratórium alkalmakkor.
10. Követelmények

Szorgalmi időszakban:

A féléves munkát kéthetente szervezett, a tematikában rögzített mérföldkövek mentén kell elvégezni. Követelmény a 6 db alkalomból legalább 4 db sikeres teljesítése a meghatározott időben, azaz a félév során 2 db mérföldkő késedelmes teljesítése engedélyezett. A félév végi jegyet a 6 mérföldkő eredményéből és az évvégi beszámoló jegyéből számoljuk. A heti ütemterv a következő:

1. Felvezetés, választható feladatok ismertetése, feladatkiadás (jelenléti)
2. online konzultációs lehetőség órarendi időben
3. M1: Projektterv bemutatás, Adatelőkészítés terv (jelenléti)
4. online konzultációs lehetőség órarendi időben
5. M2: Adatelőkészítés bemutatás, Adatvizualizáció terv (jelenléti)
6. online konzultációs lehetőség órarendi időben
7. M3: Adatvizualizáció bemutatás, GT modellek terv (jelenléti)
8. online konzultációs lehetőség órarendi időben
9. M4: GT modellek bemutatás, GT értékelés terv (jelenléti)
10. online konzultációs lehetőség órarendi időben
11. M5: GT értékelés bemutatás, Alkalmazás terv (jelenléti)
12. online konzultációs lehetőség órarendi időben
13. M6: Alkalmazás bemutatás (jelenléti)
14. Pótlási lehetőség


Vizsgaidőszakban: -

11. Pótlási lehetőségek A max. 2 db mérföldkő elmulasztása esetén kötelező a következő mérföldkő esedékességére (vagy a 6. mérföldkő esetén a szorgalmi időszak utolsó előtti hetére) elkészíteni a pótlandó eredményeket.
12. Konzultációs lehetőségek A választott adatbányászati feladat tulajdonosának (ld. Tárgy előadói) rendelkezésre állásának megfelelően, lehetőleg heti 1 alkalommal, rögzített idősávban, online csatornán.
13. Jegyzet, tankönyv, felhasználható irodalom [1] Bodon Ferenc, Buza Krisztián: Adatbányászat, 2013, http://www.cs.bme.hu/~buza/pdfs/adatbanyaszat-cover.pdf
[2] Farkas Richárd, Kardkovács Zsolt Tivadar, Kovács László, Répási Tibor, Szarvas György, Szaszkó Sándor, Tikk Domonkos, Vázsonyi György: Szövegbányászat, 2007
[3] scikit-learn, 2022, https://scikit-learn.org/
[4] pandas, 2022, https://pandas.pydata.org/
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra18
Felkészülés zárthelyire 
Házi feladat elkészítése90
Kijelölt írásos tananyag elsajátítása 
Vizsgafelkészülés 
Összesen150