Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Adatbányászati technológiák

    A tantárgy angol neve: Data Mining Technologies

    Adatlap utolsó módosítása: 2012. május 30.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar
    Mérnök informatikus szak

    Villamosmérnöki Szak

     Szabadon választható tárgy

     

     

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VITMAV67   2/0/2/v 4  
    3. A tantárgyfelelős személy és tanszék Dr. Henk Tamás, Távközlési és Médiainformatikai Tanszék
    4. A tantárgy előadója
    Név:

     

    Beosztás:

     

    Tanszék, Int.:

     

    Gáspár-Papanek Csaba

     

    Ügyvivő szakértő

     

    TMIT

     

    5. A tantárgy az alábbi témakörök ismeretére épít

    Nincs

    6. Előtanulmányi rend
    Ajánlott:

    Tematikaütközés miatt a tárgyat csak azok vehetik fel, akik korábban nem hallgatták a következő tárgyakat:

    vima5309           Adatbányászat laboratórium

    7. A tantárgy célkitűzése A tárgy célja, hogy bevezetést és gyakorlati ismereteket adjon a vezető adatbányászati szoftverek használatáról. A tárgy elméleti összefoglalást ad a adatbányászati szoftverrendszerek architektúrájáról, az adatbányászati folyamatok felépítéséről, a tipikus feladatokról, majd a labor keretein belül gyakorlati példák és mintaadathalmazok feletti adatbányászati gyakorlatokat hajtunk végre.

     

    8. A tantárgy részletes tematikája Előadások tematikája:

     

    • Adatbányászat fogalma, adatbányászati szoftverek fontossága, piac bemutatása, vezető termékek rövid bemutatása, független elemzések bemutatása, piacvezető és nyílt forráskódú rendszerek kiemelése

       

    • Adatbányászati folyamat metodikái, CRISP-DM folyamata, tipikus feladatok és modellezési technikák bemutatása, modellértékelés kérdései

       

    • Nyílt forráskódú adatbányászati szoftverek bemutatása, WEKA rendszer ismertetése, adatformátumok, eszközkészlet, modellkészlet, architektúra, felületek

       

    • SPSS Clementine rendszer bemutatása. Táblázatos adatmodell, @function rendszer bemutatása, adatfeldolgozási módszerek, számlálózás, címkézés. Modellezési technikák, modell fogalma, modell visszahelyezés.

       

    • SPSS Clementine szerver – kliens architektúra, SQL pushback módszerek, memóriagazdálkodás, szkript nyelve és kifejezőereje

       

    • SPSS Clementine CLEF architektúra, új csomópontok behelyezésének kérdése, létező kiegészítések bemutatása, Webmining modul bemutatása

       

    • Oracle Data Mining, Oracle Data Miner, alkalmazás architektúra, adatfilozófia. Skálázható modellezési technikák (O-Cluster, nemnegatív mátrix felbontás, szupport vektor gépek, stb.). Teljesítmény és performancia kérdések, kifejezőerő.

       

    • SAS üzleti intelligencia megoldások, SAS rendszer architektúrája, SAS Enterprise Miner és a SAS Base rendszer kapcsolata, programnyelvének bemutatása

       

    • SAS Enterprise Miner adatbányászati metodikája (SEMMA), adatmodellje, modellezési technikáinak rövid bemutatása és értékelése

       

    • Eddig ismertetett rendszerek és metodikák összehasonlítása, egymáshoz való viszonya. További eszközök rövid bemutatása

    Laboratóriumi foglalkozások tematikája:

    • Több tipikus feladatot fogalmazunk meg, amit különböző adatelőkészítési és modellezési technikával oldunk meg a különböző adatbányászati szoftverekkel. A labor során a következő szoftverekkel ismerkednek meg a hallgatók:
      • WEKA
      • SPSS Clementine
      • Oracle Data Mining
      • SAS Enterprise Miner
    • A labor célja, hogy valós adathalmazok felett szerezzenek a hallgatók elemzői tapasztalatokat, illetve hogy az otthoni feladat megoldásához szükséges alapvető szoftverkezelési gyakorlatot megszerezzék.

       

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Heti 90 perc előadás és heti 90 perc laboratórium

     

    10. Követelmények a. A szorgalmi időszakban: Zárthelyi dolgozat és otthoni feladat elkészítése

     

    b. A vizsgaidőszakban: Vizsga

     

    c. Elővizsga: Van

     

     

     

    11. Pótlási lehetőségek A TVSz-ben meghatározott módon megfelelő számú pótZH, gyakIV, késői otthoni feladat beadás

     

    12. Konzultációs lehetőségek Laborgyakorlatok során

     

    13. Jegyzet, tankönyv, felhasználható irodalom
    • Dr. Abonyi János: Adatbányászat a hatékonyság eszköze, Computerbooks, Budapest 2006

       

    • Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004.
    • A szoftvercsomagokhoz tartozó dokumentációk
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra56
    Félévközi készülés órákra15
    Felkészülés zárthelyire10
    Házi feladat elkészítése24
    Kijelölt írásos tananyag elsajátítása 0
    Vizsgafelkészülés15
    Összesen120
    15. A tantárgy tematikáját kidolgozta
    Név:

     

    Beosztás:

     

    Tanszék, Int.:

     

    Gáspár-Papanek Csaba

     

    Ügyvivő szakértő

     

    TMIT