Üzleti intelligencia

A tantárgy angol neve: Business Intelligence

Adatlap utolsó módosítása: 2019. március 6.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
Mérnökinformatikus MSc szak, Alkalmazott Informatika főspecializáció
Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VIAUMA02 2 2/1/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Ekler Péter,
4. A tantárgy előadója

Név:

Beosztás:

Tanszék, Int.:

Dr. Ekler Péter

docens

Automatizálási és Alkalmazott Informatikai Tanszék

Dr. Dudás Ákos

docens

Automatizálási és Alkalmazott Informatikai Tanszék

5. A tantárgy az alábbi témakörök ismeretére épít

Adatbázisok, számítógépes hálózatok, objektum orientált programozás

6. Előtanulmányi rend
Kötelező:
NEM
(TárgyEredmény( "BMEVIAUMA24", "jegy" , _ ) >= 2
VAGY
TárgyEredmény("BMEVIAUMA24", "FELVETEL", AktualisFelev()) > 0)

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rend az adott szak honlapján és képzési programjában található.

Ajánlott:

BMEVITMA311 Adatbázisok

BMEVIIIMA04 Szolgáltatásorientált rendszerintegráció

7. A tantárgy célkitűzése

A tárgy célja, hogy a hallgatók olyan versenyképes tudásra tegyenek szert, melyre folyamatos igény van az ipar részéről: modern adattárház építése, üzleti intelligencia rendszer tervezése, adattovábbítás, riportok, jelentések készítése, grafikonok, dashboardok (vezérlőpultok) fejlesztése, adatvizualizáció, adatok földrajzi elemzése és megjelenítése, KPI-k feltárása és alkalmazása, illetve churn és csalásdetektálás.

8. A tantárgy részletes tematikája

 

Előadás anyaga

1.

Az előadás kertében az üzleti intelligenciához tartozó alapfogalmak kerülnek ismertetésre. Ismertetésre kerül továbbá az adattárházak, adatpiacok és döntéstámogatási folyamatok fogalma alkalmazott informatikai szemszögből.

2.

Bemutatásra kerül az üzleti intelligencia rendszerek kiépítési folyamata, az architektúra és a komponensek szempontjából. Ezt követően áttekintésre kerülnek a napjainkban elérhető modern üzleti intelligencia rendszerek, illetve azok alkalmazási területei.

3.

Az előadás keretin belül a modern adattárolási technikák kerülnek bemutatásra alkalmazási területek szempontjából. Kitérünk a Relációs és NoSQL megoldásokra (Mongodb, Redis, Elasticsearch), az adattárházakra, valamint a tipikus adat rétegekre alkalmazás példákon keresztül. Bemutatjuk, hogyan támogathatók a különféle kliensek. Szövegfeldolgozási problémákhoz bemutatásra kerül az Elasticsearch adatbázis és analízis képességei, valamint a gyors aggregációs képessége.

4.

Ismertetésre kerülnek az alkalmazás készítés során gyakran szükséges ETL/ELT folyamatok, illetve bemutatjuk a folyamat létrehozási és testreszabás lehetőségeket. Ezt követően a gyakran előforduló adatgyűjtési, adattisztítási folyamatok, valamint a normalizálás, diszkretizáció és KPI kiválasztás kerül bemutatásra.

5.

Az előadás keretében a komplex esemény feldolgozás kerül ismertetésre, valamint bemutatjuk a több adatforrás összekapcsolási lehetőségeket és a komplex esemény felismerést beléértve a csalás detektálás módszereit alkalmazott lehetőségek szemszögéből. Az előadás során olyan adatforrásokat vizsgálunk meg mint a mobil kliensek, webes felületek, beágyazott rendszerek és asztali alkalmazások.

6.

Az előadás során az adat vizualizáció klasszikus és modern (reszponzív) lehetőségei kerülnek ismertetésre. Emellett bemutatásra kerülnek a megjelenítési lehetőségek, a testre szabható reportok/dashboard-ok, valamint a szűrési, beágyazhatósági és ütemezési lehetőségek. Az előadás célja, hogy áttekintse az adat megjelenítési lehetőségeket alkalmazott szoftverfejlesztési szempontokból. Az Elasticsearch platformhoz kapcsolódóan bemutatásra kerül a Kibana vizualizációs eszköz.

7.

Az előadás során a már bemutatott technikák és alkalmazási területek szemszögéből mélyebben összehasonlításra kerülnek a különböző modern, gyakran alkalmazott üzleti intelligencia megoldások. Kitérünk az előnyök és hátrányok bemutatására, illetve az integrációs lehetőségekre.

8.

A legtöbb üzleti intelligencia rendszer biztosít egyfajta SDK-t (Software Development Kit), mely lehetőséget nyújt a megoldások kiterjesztésére és testreszabására. Az előadás keretein belül ezen SDK-kat tekintjük át és gyakorlati példákon keresztül mutatjuk be azok szerepét.

9.

Ezen alkalom során az alapvető és gyakran használt statisztikai szoftverek kerülnek bemutatásra, kitérve azok alkalmazási és integrációs lehetőségre. Emellett az előadás kereteiben az idősoros adatok és idősoros elemzés felhasználási és alkalmazási lehetőségei is ismertetésre kerülnek. Bemutatjuk az adatbányászat alapvető problémáit, illetve a népszerű Pandas & Jupyter szoftverkörnyezetet az „adattudós” („data scientist”) eszköztárát.

10.

Bemutatásra kerülnek a gyakran használt és alkalmazott BigData alapfogalmak és szoftveres eszközök. Az előadás keretein belül ismertetésre kerülnek azon alkalmazási területek, ahol elengedhetetlen BigData megoldások megvalósítása rávezetve a BigData rendszerek szükségességére.

11.

Az előadás keretin belül a Hadoop rendszer kerül bemutatásra alkalmazási és felhasználói terület szempontjából. Bevezetjük a Hadoophoz kapcsolódó alapfogalmakat, valamint a már bevált és gyakran alkalmazott kiegészítő technológiákat, mint például a Hive és az Impala. Szintén az előadás célja a Hadoop fejlesztés alapjainak bemutatása az API-n keresztül.

12.

Ismertetjük a Hadoop gyakorlati felhasználhatóságának lehetőségeit esettanulmányokon keresztül. Részletezzük az adat betöltés, tárolás és megjelenítési lehetőségeket, a különféle adatkezelési elveket, az adatok elérhetővé tételét, valamint a kliensekkel való együttműködést. Emellett kitérünk a mobil eszközök támogatásának kérdéskörére is.

13.

Az előadás során áttekintést adunk a felhő szolgáltatások képességeiről BigData szempontból. Ismertetjük a gyakran alkalmazott felhő alapú megoldásokat és több BigData megoldást támogató felhő szolgáltatást összehasonlítunk alkalmazott informatikai szempontok mentén.

14.

Az előadás célja a bemutatott elméleti eszközök és fogalmak alkalmazása esettanulmányok vizsgálata segítségével. Az alkalom során több megoldás kerül bemutatásra és elemezzük azok előnyeit, hátrányait és továbbfejlesztési lehetőségeit.

 

 

Gyakorlat anyaga

1.

A gyakorlat keretein belül egy példa relációs adatbázis létrehozását mutatjuk be modern adatbázis kezelési eszközök segítségével. Emellett a labor kitér az adatbázis megoldások kiegészíthetőségére és programozási lehetőségeire.

2.

A gyakorlat során a hallgatónak lehetősége nyílik egy NoSQL alapú adatbázis létrehozására. Ezt követően különböző feladatok kerülnek végrehajtásra az adat betöltés, lekérdezhetőség és kimentés bemutatására.

3.

A gyakorlat során egy üzleti intelligencia rendszer ETL kezelőjével ismerkedhet meg a hallgató. A gyakorlat magában foglalja több egyszerű és összetett ETL folyamat létrehozását, ahol az adatmozgatás, adattisztítás és aggregáció létrehozás folyamatát. Emellett különböző adatforrás és nyelő is bemutatásra kerül.

4.

A gyakorlat keretein belül az adat vizualizációs módszerek és eszközök kerülnek bemutatásra. A gyakorlat részét képezi emellett reportok és dashboard-ok létrehozása is.

5.

A gyakorlat során a hallgatók megismerkednek a BI rendszerek továbbfejlesztési és kiegészítési lehetőségeivel. Bemutatjuk egy népszerű BI platform SDK képességeit és használatát egy gyakorlati példán keresztül.

6.

A hallgatók a foglalkozás keretein belül megismerkednek a Hadoop platformmal alkalmazhatósági szempontból és egy összetett gyakorlati feladat megoldását is megismerhetik.

7.

A gyakorlat célja felhő szolgáltatások alkalmazásának bemutatása. A foglalkozás során a hallgatók felhő alapú BigData megoldás felhasználásával oldanak meg egy valós feladatot.


9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

Előadás és gyakorlat.

10. Követelmények

a. A szorgalmi időszakban: egy zárthelyi

b. A vizsgaidőszakban: írásbeli vizsga

c. Elővizsga: igény szerint

  

Az aláírás megszerzésének feltétele a zárthelyi elfogadható (legalább elégséges szintű) megoldása. A vizsgára bocsátás feltétele az aláírás megléte.

11. Pótlási lehetőségek

A zárthelyihez a TVSZ előírásai szerint mind a szorgalmi, mind a pótlási időszakban 1-1 pótlási lehetőséget biztosítunk.

12. Konzultációs lehetőségek

A tárgy előadójával történt egyeztetés szerint.

13. Jegyzet, tankönyv, felhasználható irodalom
Ralph Kimball, Margy Ross - The Data Warehouse Toolkit
Ralph Kimball, Joe Caserta - The Data WarehouseETL Toolkit: Practical Techniques for Extracting, Cleaning, Conforming, and Delivering Data
David Haertzen - Data Warehousing and Business Intelligence Tutorials
(http://infogoal.com/datawarehousing/)
Jiawei Han, Micheline Kamber – Adatbányászat: Koncepciók és technikák
Hadoop, MapReduce tutorial: http://hadoop.apache.org/docs/r1.2.1/mapred_tutorial.html
Tom White - Hadoop: The Definitive Guide
Pramod J. Sadalage, Martin Fowler - NoSQL Distilled: A Brief Guide to the Emerging World of Polyglot Persistence
Stephen Few - Information Dashboard Design: Displaying data for at-a-glance monitoring
John Russel: Cloudera Impala, 2013.

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra42
Félévközi készülés órákra14
Felkészülés zárthelyire20
Házi feladat elkészítése0
Kijelölt írásos tananyag elsajátítása0
Vizsgafelkészülés44
Összesen120
15. A tantárgy tematikáját kidolgozta

Név:

Beosztás:

Tanszék, Int.:

Dr. Ekler Péter

docens

Automatizálási és Alkalmazott Informatikai Tanszék

Dr. Dudás Ákos

docens

Automatizálási és Alkalmazott Informatikai Tanszék