Adatalapú megoldások

A tantárgy angol neve: Data Products

Adatlap utolsó módosítása: 2018. június 28.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
Üzemmérnök-informatikus szak, BProf képzés
specializációtárgy
Adatalapú rendszerek specializáció
Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMBB02 4 2/2/0/v 5  
3. A tantárgyfelelős személy és tanszék Dr. Papp Dávid,
4. A tantárgy előadója

Dr. Szűcs Gábor, TMIT 

5. A tantárgy az alábbi témakörök ismeretére épít adatkezelés, mesterséges intelligencia
6. Előtanulmányi rend
Kötelező:
Training.Code=("5N-A9") ÉS

Szakirany("BPINadrend", _)

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

7. A tantárgy célkitűzése
A tantárgy célja a hallgatók megismertetése az adatfókuszú Python nyelv azon eszköztárával, amelynek segítségével megoldhatók tipikus adatközpontú problémák. A sokszínű feladatok között a hallgatók megtanulhatják a szükséges munkafolyamatokat, azaz automatikus adatletöltést, adatok integrálását és áttöltését különböző API-k segítségével (K3), illetve annak a technikáját, hogy hogyan kell a prediktív analitikai megoldásokat különböző előrejelzési környezetbe integrálni (megértés szint: magyarázatok, összefüggések ismerete, esetek felismerése, besorolása - K2). A tárgy elvégzése után a hallgató képes lesz alapszintű, integrált, adatközpontú megoldások kialakítására és üzemeltetésére (alkalmazás szint: problémamegoldás ismeretek alkalmazásával, példák, feladatok önálló megoldása - K3).
8. A tantárgy részletes tematikája

Az előadások tematikája: 

Előadás anyaga

1. Adatok típusai, alapfogalmak, tipikus felhasználási területek áttekintése

2. Python nyelv eszköztára, adatközpontú csomagjainak megismerése

3. Adatalapú problémák megoldásához szükséges munkafolyamatok

4. Adattáblák kezelése Python-ban, azok leíró és statisztikai információi 

5. Adatmanipuláció, adatelőkészítés

6. Különböző forrásból származó adatok integrálásának lehetőségei 

7. Egyszerű adatelemzési problémák, bevezetés a prediktív adatelemzési problémákba (osztályozás)

8. Prediktív adatelemzés (regresszió, nem felügyelt tanuló módszerek)

9. Az API-k felhasználásának lehetőségei input és output oldalon

10. Automatikus adatletöltés folyamata

11. Ellenőrző számonkérés

12. Prediktív analitikai megoldások különböző előrejelzési környezetbe integrálása

13. Alapszintű, integrált, adatközpontú megoldások kialakítása és üzemeltetése

14. Adatalapú megoldások a gyakorlatban


A gyakorlatok (laborok) tematikája:

Gyakorlat anyaga

1. Python adatközpontú csomagjai, iPython notebook megismerése

2. Adatbetöltés Pandas csomaggal, Pandas adatstruktúrák

3. Prediktív analitikai feladatok megoldásához használható csomagok megismerése (sklearn)

4. Webes adatletöltésen (web scraping) alapuló megoldás 

5. Webes adatletöltésen (web scraping) alapuló megoldás létrehozása csapatmunkában

6. Webes adatletöltésen (web scraping) alapuló megoldás implementálása

7. Egy komplex gépi tanulási megoldás csapatmunkában

8. REST API-kon keresztül működő gépi tanulási megoldás 

9. REST API-kon keresztül működő gépi tanulási megoldás létrehozása csapatmunkában

10. REST API-kon keresztül működő gépi tanulási megoldás implementálása

11. Komplex, folyamatos prediktív modellfrissítést végző minialkalmazás megoldása csapatmunkában

12. Egy folyamatos prediktív modellfrissítést végző minialkalmazás 

13. Egy folyamatos prediktív modellfrissítést végző minialkalmazás létrehozása csapatmunkában

14. Egy folyamatos prediktív modellfrissítést végző minialkalmazás implementálása 

 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) A tárgy gerincét a gyakorlatok keretében folyó közös mintafejlesztési feladatok adják, melyet a hallgatók csoportokban valósítanak meg.
10. Követelmények

A szorgalmi időszakban: 1 zárthelyi dolgozat (részteljesítmény értékelés)

A félév végi aláírás feltételei: a zárthelyi dolgozat (vagy pót dolgozat) legalább elégséges (40%) megírása és a gyakorlatokon legalább 70%-os részvétel.

A vizsgaidőszakban: írásbeli vizsga. A félév során a gyakorlatokhoz kapcsolódó feladatok megoldásával ajánlott vizsgajegy szerezhető.

Az osztályzat megállapításának módja: a vizsgán szerzett pontok alapján 85%-tól jeles, 70%-tól jó, 55%-tól közepes, 40%-tól elégséges, alatta elégtelen.

11. Pótlási lehetőségek Zárthelyi pótlására egy lehetőség van a szorgalmi időszakban és egy lehetőség a pótlási időszakban.
12. Konzultációs lehetőségek A tárgy előadóival előre egyeztetett időpontban.
13. Jegyzet, tankönyv, felhasználható irodalom Wes McKinney: Python for Data Analysis: Data Wrangling with Pandas, NumPy, and IPython, O'Reilly Media, Inc., Second Edition, 2017.
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra56
Félévközi készülés órákra34
Felkészülés zárthelyire20
Házi feladat elkészítése0
Kijelölt írásos tananyag elsajátítása0
Vizsgafelkészülés40
Összesen150
15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Gáspár Csaba

egyetemi tanársegéd

TMIT

Nagy-Rácz István

tanszéki mérnök

TMIT

Dr. Szűcs Gábor

egyetemi docens

TMIT