Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Mérési adatok vizuális elemzése

    A tantárgy angol neve: Visual Analysis of Measurement Data

    Adatlap utolsó módosítása: 2016. október 30.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Mérnök informatikus alapszak

    Villamosmérnöki alapszak

    Szabadon választható tantárg
    y

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIAV16   2/0/0/f 2  
    3. A tantárgyfelelős személy és tanszék Dr. Pataricza András, Méréstechnika és Információs Rendszerek Tanszék
    A tantárgy tanszéki weboldala https://www.mit.bme.hu/oktatas/targyak/vimiav16
    4. A tantárgy előadója

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Pataricza András

    egyetemi tanár

    MIT

    Gönczy László

    tanársegéd

    MIT

    Kocsis Imre

    tanársegéd

    MIT

    5. A tantárgy az alábbi témakörök ismeretére épít

    Alapvető statisztikai/valószínűségszámítási ismeretek, számítógépes rendszerek, hálózatok és operációs rendszerek alapfogalmai. Adatbázisok/táblázatkezelés alapismeretei.

    7. A tantárgy célkitűzése

    A műszaki gyakorlatban kulcsfontosságú a tapasztalati adatok gyűjtése és elemzése mind a rendszerek méretezésénél, mind teljesítmény- és időviszonyaik helyességének ellenőrzésénél. Ennek legegyszerűbb, de hatékony és a műszaki szemlélethez közel álló megközelítése a vizuális adatelemzés. Ennek tipikus alkalmazási területei: HW/SW teljesítményvizsgálat, web és felhő alapú rendszerek méretezése, komponensek közti kommunikáció vizsgálata, szűk keresztmetszetek keresése.

    A tantárgy alapvető célkitűzése megismertetni a hallgatókat a vizuális adatelemzés alkalmazási lehetőségeivel, elsődlegesen műszaki alkalmazásokban, informatikai rendszerek tervezésében és kiértékelésében. A tárgy statisztikai/elméleti alapozás után gyakorlati példákon keresztül mutatja be az elemzési folyamat főbb feladatait (adatgyűjtés és tisztítás, modellalkotás, feltáró és megerősítő elemzés, stb.).

    A tantárgy elvégzése után a hallgatók képesek lesznek méréseket tervezni, benchmarkokból és rendszermonitorozásból/logokból származó adatokat kiértékelni, a rendszer működéséből adódó sajátosságokat (pl. elemek közti függőségek, kapcsolatok) az elemzés során módszeresen felhasználni, ill. a rendszerről alkotott feltételezéseket elemzésekkel kiértékelni és alátámasztani. Az elemzési eredmények hatékonyan fejleszthető, intuitív felületeken keresztül különböző részletességgel és fókusszal tudják megjeleníteni mind informatikusok/rendszermérnökök, mind a rendszerek felhasználói ill. megrendelői számára.

    A tárgy oktatása során elsősorban a vizuális megjelenítésre helyezzük a hangsúlyt, korszerű vizuális elemzési technológiákon keresztül ismertetve az alapvető módszereket, emellett kitekintünk a széles körben használt R nyelv interaktív vizualizációs lehetőségeire.

    8. A tantárgy részletes tematikája

    A tárgy az alapvető fogalmak és technológiák bevezetése után azok műszaki felhasználására koncentrál.

    1. hét: Statisztikai és metrológiai alapok. Statisztikai alapfogalmak, mértékek fajtái, mérésekkel szembeni tipikus követelmények. Adattípusok és adatszerkezetek.  Adatok közti függőségek: korreláció, asszociáció, kauzalitás. Előzetes (a priori) ismeretek felhasználása.

    2. hét: Vizuális elemzés alapok. Feltáró/megerősítő (Exploratory/Confirmatory) analízis. Főbb plot típusok (1, 2, n dimenzió) és felhasználásuk.

    3. hét: Interaktív technológiák, data tours (esettanulmány). Egyedi vizualizáció példák, eloszlások megjelenítése, ötszámos jellemzés (five-number summary), nemparametrikus statisztika. Kihívások: interaktivitás, skálázhatóság (információ és megjelenítés), megismételhető/kollaboratív elemzés.

    4. hét: Vizuális elemzés technológiai támogatása: szkript nyelvek (R, Python), vizuális folyamattervező eszközök (Knime, RapidMiner, TensorFlow, Orange, ...), hagyományos „BI" eszközök felhasználása (Microsoft PowerBI, Tableau, ...). Felhő alapú analitika (Microsoft Cortana Analytics, IBM Watson Analytics). Vizuális megjelenítő könyvtárak: JS alapú megoldások (D3.js, Processing, chart könyvtárak), Dashboard keretrendszerek (Graphite, CGP, ...). Eltérés a célokban, beágyazott heurisztikák torzító hatása, implicit feltételezések feltárása, az egyes technológiák összehasonlítása.

    5. hét: Mérnöki modellek felhasználása adatelemzésben: Oksági kapcsolatok, topologikus korreláció, sorrendiség és viselkedésmodellek figyelembevétele, változószelekció. Minőségi modellek (Qualitative Reasoning).

    6. hét: Kezdeti vizuális kiértékelés (esettanulmány), az eddig ismertetett módszerek bemutatása néhány reprezentatív példán (pl. felhő alapú rendszerek teljesítménymérése).

    7. hét: Adatgyűjtés és -tisztítás: szakterület-specifikus adatszótár, adathiba taxonómia megalkotása, általános adatminőségi metrikák, felműszerezés, mintavételezés stb. informatikai rendszerekben. Szenzor adatforrások szemantikus leírása: az SSN szabvány.

    8. hét: Adatforrások csatolása. Tipikus mérési adatforrások: relációs adatbázisok, kulcs-érték adatbázisok, oszlopadatbázisok, gráfadatbázisok. Ontológia alapú tárolás, online adatforrások (REST,JSON, ...). R, Python terminológia.

    9. hét: Adatvezérelt modellalkotás. Klaszterezés és PCA támogatása. Klasszifikáció és csoportba sorolás. Kísérleti modellek validációja, kísérlettervezés.

    10-11. hét: A vizuális elemzés alkalmazási területeinek sajátosságai. Kiberfizikai rendszerek (CPS) elemzése, különböző domének (kiber, fizikai) kapcsolatának feltárása. Dashboard tervezés informatikai rendszerek felügyeletére, "SCADA". Szolgáltatásbiztonság és teljesítőképesség elemzése. Szoftver teljesítmény hangolás. Biztonságkritikus rendszerek fejlesztési folyamatának vizsgálata.

    12. hét: Vizuális elemzés használata rendszertervezésben. Fogalmi egységesítés. Mérés és benchmark tervezés. Informatikai modellek szimulációjának hatékony kiértékelése. Reprezentáció transzformálása.

    13. hét: Rendszerek kiértékelés vizuális módszerekkel. Teszt- és tesztkészlet-kiértékelés támogatása. Logelemzés és eseményfeldolgozás komplex, felhő alapú rendszerekben. Kiugró értékek (outlier) keresése.

    14. hét: Komplex esettanulmány.

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás.
    10. Követelmények

    a. A szorgalmi időszakban: egy házi feladat elkészítése és egy zárthelyi dolgozat megírása. A házi feladat egy önállóan elkészített, saját mérésből vagy publikus adatforrás(ok)ból származó adatkészleten elvégzett, elsősorban vizuális technikákra építő, megismételhető elemzés megfelelően dokumentálva.

    b. A vizsgaidőszakban: -

    c. Elővizsga: -

    11. Pótlási lehetőségek

    A TVSZ szerint:

    Házi feladat: a pótlási héten pótolható (különeljárási díj ellenében).

    Zárthelyi dolgozat: egy alkalommal a szorgalmi időszakban, ill. a pótlási héten különeljárási díj ellenében pótolható.

    12. Konzultációs lehetőségek

    Az oktatókkal előre egyeztetett időpontban. Emellett elérhetővé tesszük a tárgyban használt eszközök technikai útmutatóin és oktató videóin kívül saját, szemléltető példákat a tárgyhonlapon.

    13. Jegyzet, tankönyv, felhasználható irodalom

    1. Chen, Chun-houh, Wolfgang Karl Härdle, and Antony Unwin, eds. Handbook of data visualization. Springer Science & Business Media, 2007.

    2. Theus, Martin, and Simon Urbanek. Interactive graphics for data analysis: principles and examples. CRC Press, 2008.

    3. Antal Péter (szerk.). Intelligens adatelemzés. Typotex Kiadó, 2014. Elektronikusan elérhető jegyzet.

    4. Imre Kocsis, Ágnes Salánki, and A. Pataricza, "Measurement-based identification of infrastructures for TCPS," in Trustworthy Cyber-Physical Systems Engineering, A. Romanovsky and Fuyuki Ishikawa, Eds. Chapman and Hall/CRC, 2016.

    5. Pataricza, András, et al. "Empirical Assessment of Resilience." Software Engineering for Resilient Systems. Springer Berlin Heidelberg, 2013. 1-16.

    További eszközspecifikus segédanyagok (pl. Adam Aspin, „High Impact Data Visualization with Power View, Power Map, and Power BI", Apress, 2014), online segédanyagok, példák.

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra 28
    Félévközi készülés órákra 
    Felkészülés zárthelyire 12
    Házi feladat elkészítése 20
    Kijelölt írásos tananyag elsajátítása 
    Vizsgafelkészülés 
    Összesen 60
    15. A tantárgy tematikáját kidolgozta

    Név:

    Beosztás:

    Tanszék, Int.:

    Dr. Pataricza András

    egyetemi tanár

    MIT

    Gönczy László

    tanársegéd

    MIT

    Kocsis Imre

    tanársegéd

    MIT

    Egyéb megjegyzések A tantárgy angol neve: Visual analysis of measurement data