Adatelemzési szoftverek

A tantárgy angol neve: Data Analysis Tools

Adatlap utolsó módosítása: 2021. február 4.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
Üzemmérnök-informatikus szak, BProf képzés
specializáció tárgy
Adatalapú rendszerek specializáció
Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMBB03 4 2/2/0/v 5  
3. A tantárgyfelelős személy és tanszék Dr. Magyar Gábor Béla,
4. A tantárgy előadója

Dr. Magyar Gábor egyetemi docens TMIT

Hollósi Gergely ügyvivő szakértő TMIT

Lukovszki Csaba tudományos segédmunkatárs TMIT 

5. A tantárgy az alábbi témakörök ismeretére épít Adatkezelés
6. Előtanulmányi rend
Kötelező:
Training.Code=("5N-A9") ÉS

Szakirany("BPINadrend", _)

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

7. A tantárgy célkitűzése A tantárgy célja, hogy a gépi tanulási feladatok megoldásához szükséges alapvető adatelőkészítési és modellezési feladatokat megismertesse a hallgatókkal (megértés szint (magyarázatok, összefüggések ismerete, esetek felismerése, besorolása - K2). A hallgatók egy felhasználói felületen keresztül, adatfolyam elvű szoftver használatán keresztül ismerhetik meg az adatelemzés alapszintű megoldásait, ily módon kaphatnak rálátást az egyes komponensekből felépíthető komplex megoldások felépítésére (alkalmazás szint: problémamegoldás ismeretek alkalmazásával, példák, feladatok önálló megoldása -K3).
8. A tantárgy részletes tematikája

Az előadások tematikája:

Előadás

Előadás anyaga

1.

Adatelemzési alapok, adatelemzési referencia modell.

2.

Az adatbányászat és adatelemzés feladatai. Deszkriptív és prediktív megközelítések.

3.

Adatelemzési eszközök jellemzői, elemzési képességei, felépítésük.

4.

Adatelőkészítési feladatok megoldása

5.

Gépi tanulási alapfeladatok megoldása: osztályozás, felhasználható algoritmikai eszköztár, visszamérési technikák: megfelelő üzleti és matematikai kiértékelők összepárosítása

6.

Fejlett osztályozási módszerek: meta tanulók, együttes osztályozók használata.

7.

Gépi tanulási alapfeladatok megoldása: regresszió, felhasználható algoritmikai eszköztár, visszamérési technikák: megfelelő üzleti és matematikai kiértékelők összepárosítása

8.

Gépi tanulási alapfeladatok megoldása: klaszterezés, felhasználható algoritmikai eszköztár, visszamérési technikák: megfelelő üzleti és matematikai kiértékelők összepárosítása

9.

Gépi tanulási alapfeladatok megoldása: anomáliadetekció, felhasználható algoritmikai eszköztár, visszamérési technikák: megfelelő üzleti és matematikai kiértékelők összepárosítása

10.

Adatvizualizációs megoldások

11.

Modellek eredményének interpretálása

12.

Idősoros adatok feldolgozása, predikció idősoros adatok esetén

13.

Szövegelemzési feladatok jellegzetességei, kezelésük. Adatfolyamok elemzése.

14.

Valós esettanulmányok bemutatása

A gyakorlatok (laborok) tematikája:

Gyakorlat

Gyakorlat anyaga

1.

Elemző eszköz alapjainak megismerése, feltáró adatelemzés

2.

Adatelőkészítési feladatok megoldása a prediktív modellek hatékonyságának növelése céljából

3.

Regressziós technikák használata használt termékek árainak előrejelzésére

4.

Regressziós technikák használata használt termékek árainak előrejelzésére (folytatás)

5.

Hitelbírálati feladat megoldása

6.

Hitelbírálati feladat megoldása (folytatás)

7.

Kampányoptimalizációs feladat megoldása

8.

Kampányoptimalizációs feladat megoldása (folytatás)

9.

Távközlési ügyfelek szegmentációja

10.

Szegmentációs modellek kiértékelése

11.

Adatvizualizációs gyakorlat

12.

Paraméteroptimalizáció

13.

Modellek interpretálásának gyakorlati aspektusai

14.

Komplex prediktív szolgáltatások létrehozása, a létrehozott megoldások üzleti folyamatokba illesztése

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Az előadásokon módszereket és az ezekhez tartozó kezelési és megoldási lehetőségeket ismertetjük, a gyakorlatokon jellegzetes, életszerű feladatokat oldanak meg a hallgatók.
10. Követelmények

A szorgalmi időszakban: 1 zárthelyi dolgozat (részteljesítmény értékelés). A félév végi aláírás feltételei: a zárthelyi dolgozat (vagy pót dolgozat) legalább elégséges (40%) megírása és a gyakorlatokon legalább 70%-os részvétel.

A vizsgaidőszakban: írásbeli vizsga. Az osztályzat megállapításának módja: a vizsgán szerzett pontok alapján 85%-tól jeles, 70%-tól jó, 55%-tól közepes, 40%-tól elégséges, alatta elégtelen.
11. Pótlási lehetőségek Zárthelyi pótlására egy lehetőség van a szorgalmi időszakban és egy díjköteles lehetőség a pótlási időszakban.
12. Konzultációs lehetőségek A tárgy előadóival előre egyeztetett időpontban.
13. Jegyzet, tankönyv, felhasználható irodalom

Dr. Abonyi János: Adatbányászat a hatékonyság eszköze, Compterbooks, 2006.

Hastie, Trevor, Tibshirani, Robert, Friedman, Jerome: The Elements of Statistical Learning. Data Mining, Inference, and Prediction, Second Edition, Springer, 2009.

Pang-Ning Tan, Michael Steinbach, Vipin Kumar: Bevezetés az adatbányászatba, Panem, 2011.
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra56
Félévközi készülés órákra34
Felkészülés zárthelyire20
Házi feladat elkészítése
Kijelölt írásos tananyag elsajátítása
Vizsgafelkészülés40
Összesen150
15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Gáspár Csaba

egyetemi tanársegéd

TMIT

Nagy-Rácz István

tanszéki mérnök

TMIT

Dr. Magyar Gábor Béla

egyetemi docens

TMIT