Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Hálózatba kapcsolt adatbázisok

    A tantárgy angol neve: Networked Databases

    Adatlap utolsó módosítása: 2022. február 11.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Gazdaságinformatikus szak

    MSc képzés

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VITMM100 1 3/1/0/v 5  
    3. A tantárgyfelelős személy és tanszék Dr. Erős Levente,
    A tantárgy tanszéki weboldala https://www.db.bme.hu/targyak/halozatba-kapcsolt-adatbazisok
    4. A tantárgy előadója

    Név:

     beosztás:

     Tanszék, Intézet:

    Dr. Erős Levente

    egyetemi adjunktus

    TMIT

    Dr. Gajdos Sándor

    t. docens

    TMIT

    Marton József Ernő

    ügyvivő szakértő

    TMIT

    Dr. Soproni Péter Balázs

    külsős

    TMIT

    5. A tantárgy az alábbi témakörök ismeretére épít

     

     

    adatbáziskezelő rendszerek felépítése, ER-modellezés, relációs adatmodell, relációs séma előállítása ER diagramból, SQL, funkcionális függőségek, normálformák (0-3NF, BCNF), redundancia, fizikai adatszervezési módszerek (heap, hash, ritka index, sűrű index, többszintű indexek), relációs lekérdezések optimalizálása, tranzakciókezelés, alapvető programozási, valamint adatszerkezetekkel és algoritmusokkal kapcsolatos ismeretek.

     

     

    6. Előtanulmányi rend
    Ajánlott:

    Akik már kreditet szereztek a BMEVITMMA13 tárgyból, azok ezt a Hálózatba kapcsolt adatbázisokat nem vehetik fel.

    7. A tantárgy célkitűzése

     

    (K1) Bemutatni, hogy az adatbáziskezelő rendszerek hardver- és szoftverkomponenseit milyen módon és miért érdemes többszörözni, hálózatba kapcsolni, hogyan épülnek fel az ilyen rendszerek, milyen előnyökkel/hátrányokkal járnak az egyes megvalósítások, mire és milyen formában lehet ezeket használni.

    (K3) Képessé tenni a hallgatót tranzakciós adatbázisokban használt adatstruktúrák megtervezésére változatos gazdasági/tudományos területekre adaptálva, amelyek nagyhatékonyságú információs rendszerek részeiként működhetnek.

    (K3) Képessé tenni a hallgatót üzleti folyamatok elemzésére használható, analitikus célú, döntéstámogató rendszerek, a gazdasági élet számos területén használt adattárházak struktúráinak megtervezésére.

    (K1) Áttekintést adni a „big data” korszak jellegzetes adatbázis-kezelési megoldásairól, elősegítve ezzel adott feladathoz legjobban illeszkedő technológia kiválasztását.

    (K2) Megismertetni a hallgatót olyan optimalizálási módszerekkel, hálózati vagy elosztott feldolgozást segítő eljárásokkal, amelyek alkalmasak arra, hogy egy adatbázis-alapú információs rendszer teljesítményét növelni lehessen.

    (K1) Esettanulmányok, megvalósítási példák segítségével megmutatni, hogy a megismert technológiák hogyan jelennek meg a legkorszerűbb, üzleti életben használt tranzakciós és döntéstámogató rendszerekben.

     

    8. A tantárgy részletes tematikája

     

    Adatbáziskezelő rendszerek-architektúrái és a párhuzamos működés 2 hét

    Centralizált vs. kliens-szerver rendszerek, Párhuzamos rendszerek, IO párhuzamosítása, Inter- és intraquery párhuzamosítás, Particionálás lehetőségei, Relációs műveletek párhuzamos végrehajtása: párhuzamos keresési, rendezési, illesztési algoritmusok, Lekérdezés-optimalizálás párhuzamos végrehajtás estén, SMP és MPP architektúrák, Párhuzamos működésű adatbáziskezelők tervezési kérdései.

    Elosztott adatbáziskezelés 2 hét

    Elosztott, hálózatba kapcsolt adatbázisok típusai, Hatékonysági megfontolások, Zárkezelési protokollok, Elosztott sorosíthatóság, Lavinamentesség biztosítása, Elosztott megegyezés: 2PC-3PC, Elosztott időbélyeges tranzakciókezelés, Csúcsok helyreállítása rendszerhibák után, Elosztott pattok kezelése.

    Extrém nagy adatmennyiségek kezelése 2 hét

    A NoSQL helye és szerepe, Google-Amazon technológiák, Skálázási kérdések, Skálázhatóság vs. erőforrások megosztása, Konzisztencia fogalmának kiterjesztése, Rendelkezésreállás, Hibatűrés, CAP tétel, NoSQL adatbáziskezelők típusai: kulcs-érték tárak, oszlopcsaládok, gráfadatbázisok, dokumentumtárak, A fontosabb megvalósítások: MongoDB, Hadoop, Cassandra.

    Adatstruktúrák tervezése ismert alkalmazásprofilhoz

    a)      Relációs struktúrák tervezése OLTP rendszerekhez (2 hét)

    A tranzakciós adatbázisrendszerek ismérvei, adatstruktúrák tervezése gyakran változó adattartalomra, tranzakciós adatbázisok alkalmazása üzleti környezetben. Adatbázis kényszerek szerepe, Sématervezés dekompozícióval, Funkcionális függések tulajdonságai, Helyesség és teljesség, Armstrong axiómái, Függéshalmaz tranzitív lezártja, Attribútumhalmaz tranzitív lezártja, Minimális függéshalmaz, Veszteségmentes sémafelbontás, Függőségőrző sémafelbontás, Sématervezés adott normálformába veszteségmentes és függőségőrző sémadekompozícióval.

    b)     Relációs struktúrák tervezése  döntéstámogató rendszerek számára (2 hét)

    Adattárházak tervezésének sajátosságai, Üzleti folyamatok elemzésére használt struktúrák tervezése, Dimenziós modellezés, Tények és dimenziók, Egyed-kapcsolat vs. dimenziós modellezés, Adattárházbusz, Dimenziós modellek készítése, Lassan változó dimenziók esete, Fizikai adatmodell tervezése.

    Memóriaalapú adatbáziskezelés 1 hét

    Diszkrezidens és memóriarezidens adatbáziskezelés, motivációk/trendek-előnyök/hátrányok, Megvalósítási kihívások: optimalizált adatszerkezetek, perzisztencia biztosítása, naplózás, tranzakciókezelés, Speciális indexstruktúrák IMDB-kben: B*-fa, AVL-fa, T-fa hatékonysága, Lekérdezések végrehajtása és költsége

    Analitikus célú információs rendszerek tervezése és megvalósítása 1 hét

    Stratégiai adatorientált döntéstámogató rendszerek alapelvei, Építőelemek, OLAP: Drill down, roll up, slice and dice; Analitikus rendszerek implementációs technológiái, Implementációs módszertanok, ETL folyamat, Adatminőség és adattisztítás szerepe, Valósidejűség értelmezései, Technológiai megoldások a valósidejűség megvalósítására, CTF (Capture-Transform-Flow).

    Adatbáziskezelők teljesítménymérése és hangolása 1 hét

    A teljesítménymérés céljai és kihívásai, Benchmarkok felállításának szabályai, ill. szabadságfokai, Adatstruktúrák és adatok, TPC-C, TPC-E, TPC-H, A hangolás szintjei, eszközei, Bevált módszerek a teljesítmény javítására. Esettanulmány.

    Szemantikus adatkezelés 1 hét

    A szemistrukturált adatok sajátosságai, hatékony kezelésük lehetőségei adatbázisokban, Szemantikus elemek tárolása XML adatformátumban, XML séma, Adatreprezentáció RDF formában, Az RDF lehetőségei és korlátai, RDF sémaleíró nyelvek, Ontológia fogalma, Kapcsolat a szemantikus webbel, Szemistrukturált adatok tárolása, szemistrukturált adatbázisok.


     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

     

    3 óra előadás/hét, + gyakorlat/ házi feladat. A házi feladat során üzleti életből vett folyamatokat megvalósító tranzakciós rendszer, valamint egy döntéstámogató adattárház struktúráját készítik el a hallgatók.A gyakorlatok keretében a kiadott házi feladatok megoldásának folyamatos konzultálása valósul meg. A hallgatók átlagosan kéthetente beszámolnak az előrehaladásukról, amely során értékeljük az időközben végzett munkát, korrigáljuk annak esetleges hibáit, megbeszéljük a soron következő lépéseket és az esetleges alternatívákat.


     

    10. Követelmények

     

    A szorgalmi időszakban: 1 db zárthelyi és egy házi feladat. Feladatkiadás a 4., beadás a 12. héten. Az aláírás feltétele a zárthelyi és a házi feladat külön-külön legalább elégséges teljesítése.

    A vizsgaidőszakban: Szóbei vizsga, melynek keretében egyrészt meg kell védeni a házi feladat megoldását, másrészt kérdések hangzanak el a tárgy teljes anyagából. A végső jegy számítása: 30% ZH + 20% HF + 50% vizsga, de mindegyiknek legalább elégségesnek kell lennie.


     

    11. Pótlási lehetőségek

     

    1 db Pótzárthelyi a szorgalmi időszakban. Az HF beadása legkésőbb a 13. heti pótbeadási határidőig teljesíthető.


     

    12. Konzultációs lehetőségek

     

    A házi feladatok megoldásának rendszeres bemutatása keretében erre reguláris lehetőség nyílik átlagosan kéthetente, ezen felül igény szerint előzetesen egyeztetett időpontokban.

     

    13. Jegyzet, tankönyv, felhasználható irodalom

    [1]   Gajdos: Adatbázisok, 2019. https://db.bme.hu/~gajdos/Adatbazisok2019.pdf

    [2]   Silberschatz, H. F. Korth, S. Sudarshan: Database System Concepts, 6th Edition, 2010. WCB/McGraw-Hill, ISBN 0-07-295886-3

    [3]   Oracle Database Concepts 12c, 2014.

     http://docs.oracle.com/database/121/CNCPT/E41396-10.pdf

    [4]   Oracle Exadata white paper, 2012:

     http://www.oracle.com/technetwork/database/exadata/exadata-technical-whitepaper-134575.pdf

    [5]   Oracle Data Warehousing Guide 11g, 2007.

     http://docs.oracle.com/cd/B28359_01/server.111/b28313.pdf

    [6]   www.tpc.org

    [7]   Web-en elérhető oldalak elsősorban a NoSQL körbe tartozó témák esetén


    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

    Kontaktóra

      56

    Félévközi készülés órákra

      20

    Felkészülés zárthelyire

      16  

    Házi feladat elkészítése

      42

    Kijelölt írásos tananyag elsajátítása

       -

    Vizsgafelkészülés

      16

    Összesen

    150

     

    15. A tantárgy tematikáját kidolgozta

     Név:

     Beosztás:

     Tanszék, Intézet:

    Dr. Gajdos Sándor

    t. docens

    TMIT

    Dr. Erős Levente

    egy. adjunktus

    TMIT

    Marton József Ernő

    ügyvivő szakértő

    TMIT