Adattárházak tervezése és megvalósítása

A tantárgy angol neve: Design and Implementation of Data Warehouses

Adatlap utolsó módosítása: 2009. október 1.

Tantárgy lejárati dátuma: 2012. július 2.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mérnök informatikus szak

Szabadon választható tantárgy
 

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMBV10   2/2/0/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Gajdos Sándor,
4. A tantárgy előadója
 Név: Beosztás: Tanszék, Intézet:
 Dr. Gajdos Sándor mestertanár TMIT
 Dr. Kardkovács Zsolt Tivadar egy. tanársegéd TMIT
5. A tantárgy az alábbi témakörök ismeretére épít Adatbázis-kezelési ismeretek
6. Előtanulmányi rend
Kötelező:
NEM ( TárgyTeljesítve("BMEVITT5313") )
VAGY
NEM KépzésLétezik("5N-07") VAGY
NEM KépzésLétezik("5N-A7") VAGY
NEM KépzésLétezik("5N-M7")

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

Ajánlott:

A tantárgy akkor vehető fel, ha a hallgatónak legalább aláírása van az Adatbázisok (VITMA311 vagy VIMA3232) c. tantárgyból.

Úgyszintén felvehetik a tantárgyat, akiknek más intézményben szerzett gazdaságinformatikus, mérnök informatikus vagy programtervező informatikus BSc diplomája van.

A tantárgy nem vehető fel, amennyiben a hallgató már hallgatta az Információmenedzsment (VITT5313) c. tantárgyat.

7. A tantárgy célkitűzése

Cél, hogy a tantárgy keretében a hallgatók behatóan tanulmányozhassák az adattárházak legfontosabb elemeit, működését, megvalósításának bevált módszereit. A tantárgy keretében az általános technológiai alapoktól indulva, a fő hangsúlyt a technológiára helyezve betekintést adunk abba, hogy milyen mechanizmusokon keresztül lehetséges a gazdálkodó szervezetek számára közvetlen üzleti hasznot eredményező információkat szállítani tudó informatikai rendszereket tervezni és megvalósítani.

Megszerezhető képességek: Az adatbáziskezelők hagyományos alkalmazási területe a tranzakcióorientált működésű rendszerek megvalósítása. Az üzleti intelligencia, ill. döntéstámogatási célú rendszerek tervezése és megvalósítása alapvetően különböző szemléletet és módszereket igényel. A hallgatók megismerik ezeket a különbségeket, és képesek lesznek ilyen rendszerek specifikálására, tervezésére és megvalósítására.

Az előadásokon elhangzott tananyaghoz számítógépes gyakorlatok kapcsolódnak, melyek során a hallgatók jártasságot szereznek a fejlesztéséhez használt egyes eszközök kezelésében is.

8. A tantárgy részletes tematikája

1. hét

Bevezetés: az adattárház mint közmű. Inmon definíciója. Adattárházak evolúciója, elemei. Adattárházak helye és szerepe a vállalat fejlődési ciklusában, analógiák Maslow szükségletelméletével, Üzleti intelligencia (BI) definíciója, viszonyrendszerük.

Gyakorlat: Saját szoftver környezet megteremtése

2. hét

Dimenziós modellezés. Egyed-kapcsolat vs. dimenziós modellezés. Relációs, multidimenziós implementálás, Tipikus ténytáblák, tipikus dimenziós táblák. A vállalat kritikus üzleti folyamatai, megjelenítésük az adattárházban. Adattárház busz. Alap modellezési technikák.

Gyakorlat: Bevezetés az Oracle Warehouse Builder használatába

3. hét

Kibővített dimenziós tervezés, tervezési minták, Role-playing dimenziók, Junk dimenziók, Degenerált dimenziók, Lassan változó dimenziók, Kibővített ténytábla tervezés, Ténynélküli tények, Additív és nem additív tényadatok, Állapot és esemény-tények

Gyakorlat: Dimenziós modellek készítése

4. hét

Adattárház architektúrák. Koncepcionális architektúra, Adatarchitektúra, Eszközarchitektúra, Üzemeltetési architektúra, Operational Data Store, Nem tervezett döntéstámogatás, Szakterületi adattárak szemantikai integrálása, Virtuálisan integrált szakterületi adattárak, Hub-and-spoke

Gyakorlat: Partícionálás hatása a végrehajtási tervre, csillag transzformáció működése bitmap indexek használatával

5. hét

Állomásoztatás. Az értékteremtési folyamat, Illeszkedő adatmodellek, Dimenziós adatok állomásoztatása. Bulk loading feltételei és következményei, Ténytábla betöltések. Implementálás flat file-on vs. adatbázisban,

Gyakorlat: Oracle CDC működése, implementálása

6. hét

Adatbázis példány tervezése. Memóriaigény becslése, Fizikai adatstruktúrák tervezése. Adatkinyerés, Változáskinyerés vs. full extract, Eseményvezérelt vs. periodikus adatkinyerés, Tranzakcióorientált vs. táblaorientált kinyerés. A tranzakció kontextus kinyerésének jelentősége

Gyakorlat: SQL*Loader használata adatbetöltés megvalósítása során

7. hét

Infrastruktúra.. Számítógép-hálózat, Hardver architektúra, Kereskedelmi szoftver eszközök: ETL, front-end, Üzemeltetési szempontok, Megvalósítási jellegzetességek SMP környezetben. Szemantikus, technikai, navigációs és üzemeltetési metaadatok, Metaadat tárak és modellek

Gyakorlat: Egyszerű ETL folyamat összeállítása OWB használatával

8. hét

Adattárházak életciklusa. Megvalósítási módszertanok: Hadden-Kelly módszertan, Oracle Warehouse Method, Kimball módszertana, Kimball vs. Inmon megközelítés, Bottom-up, top-down tervezés, A követelmények összegyűjtése. Sikerkritériumok fajtái és szerepük.

Gyakorlat: Analitikus rendszer felépítése OWB segítségével

9. hét

Adatminőség és adattisztítás. Adatminőségi standard fogalma és jelentősége, Tipikus adathibák, Javítás a forrásrendszerben, Címek és nevek javításának sajátosságai, Az adattisztítási alprojekt mérete, helye és jelentősége.

Gyakorlat: Adatminőség ellenőrzése OWB használatával

10. hét

Stratégiai és operatív döntéstámogatás. Nagytömegű végfelhasználó kiszolgálásának kérdései. Aggregátumok jelentősége, tervezése és használata, Dimenzió kompressziója, átlagos együttes előfordulási gyakoriság, Összegzések tárolásának lehetőségei, Aggregátum navigáció, Query rewrite

Gyakorlat: Materializált nézetek definiálása, query rewrite működésének vizsgálata

11. hét

Az operatív döntéstámogatás kihívásai. Magas rendelkezésreállás megvalósításának lehetőségei. Változásadatok kezelése, Frissítési gyakoriság megválasztása és jelentősége, statikus és dinamikus tartalom szétválasztása, Lassan változó adatok kezelése

Gyakorlat: Zárthelyi

12. hét

Adattárházak sajátosságai MPP környezetben, Ad hoc lekérdezések kiszolgálása, Teradata active warehousing, Hewlett-Packard OneView, HP-Oracle Exadata

Gyakorlat: Adatbetöltések relációs dimenziós struktúrákba

13. hét

Illusztratív példák adattárházak építésére és használatára I.

Távközlési nagyvállalati adattárház jellegzetes felépítése, a projekt sajátosságai.

Gyakorlat: Demonstráció: Üzleti elemzések. Balanced Scorecard – stratégiai teljesítménymenedzsment.

14. hét

Illusztratív példák adattárházak építésére és használatára II.

Pénzügyi környezetben megvalósított adattárház jellegzetes felépítése, a projekt sajátosságai.

Gyakorlat: Elővizsga

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

 Előadás és számítógépes gyakorlat

10. Követelmények
  • A szorgalmi időszakban: egy zárthelyi.
  • A vizsgaidőszakban: írásbeli vizsga
11. Pótlási lehetőségek

A zárthelyi pótlási lehetősége: 1 PZH a szorgalmi időszakban és egy PPZH a pótlási héten.

12. Konzultációs lehetőségek

A tárgy előadójával egyeztetett időpontban.

13. Jegyzet, tankönyv, felhasználható irodalom
  1. R. Kimball, L. Reeves, M. Ross, W. Thornthwaite: The Data Warehouse Lifecycle Toolkit: Expert Methods for Designing, Developing, and Deploying Data Warehouses, Wiley, 2nd edition, 2008.
  2. W. H. Inmon: Building the Data Warehouse, Wiley, 3rd edition, 2005.
  3. Oracle RDBMS, Warehouse Builder felhasználói dokumentáció

 

 

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra  56
Félévközi készülés órákra  14
Felkészülés zárthelyire  10
Házi feladat elkészítése   -
Kijelölt írásos tananyag elsajátítása  10
Vizsgafelkészülés  30
Összesen120
15. A tantárgy tematikáját kidolgozta
 Név: Beosztás: Tanszék, Intézet:
 Dr. Gajdos Sándor mestertanár TMIT
 Dr. Kardkovács Zsolt Tivadar egy. tanársegéd TMIT
 Radnai Szabolcs  Oracle Magyarország Kft.
 Szabad Miklós  Oracle Magyarország Kft.
 Wagner Kornél  Hewlett-Packard Magyarország Kft.