Adatbányászati technológiák

A tantárgy angol neve: Data Mining Technologies

Adatlap utolsó módosítása: 2012. május 30.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar
Mérnök informatikus szak

Villamosmérnöki Szak

 Szabadon választható tárgy

 

 

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMAV67   2/0/2/v 4  
3. A tantárgyfelelős személy és tanszék Dr. Henk Tamás,
4. A tantárgy előadója
Név:

 

Beosztás:

 

Tanszék, Int.:

 

Gáspár-Papanek Csaba

 

Ügyvivő szakértő

 

TMIT

 

5. A tantárgy az alábbi témakörök ismeretére épít

Nincs

6. Előtanulmányi rend
Ajánlott:

Tematikaütközés miatt a tárgyat csak azok vehetik fel, akik korábban nem hallgatták a következő tárgyakat:

vima5309           Adatbányászat laboratórium

7. A tantárgy célkitűzése A tárgy célja, hogy bevezetést és gyakorlati ismereteket adjon a vezető adatbányászati szoftverek használatáról. A tárgy elméleti összefoglalást ad a adatbányászati szoftverrendszerek architektúrájáról, az adatbányászati folyamatok felépítéséről, a tipikus feladatokról, majd a labor keretein belül gyakorlati példák és mintaadathalmazok feletti adatbányászati gyakorlatokat hajtunk végre.

 

8. A tantárgy részletes tematikája Előadások tematikája:

 

  • Adatbányászat fogalma, adatbányászati szoftverek fontossága, piac bemutatása, vezető termékek rövid bemutatása, független elemzések bemutatása, piacvezető és nyílt forráskódú rendszerek kiemelése

     

  • Adatbányászati folyamat metodikái, CRISP-DM folyamata, tipikus feladatok és modellezési technikák bemutatása, modellértékelés kérdései

     

  • Nyílt forráskódú adatbányászati szoftverek bemutatása, WEKA rendszer ismertetése, adatformátumok, eszközkészlet, modellkészlet, architektúra, felületek

     

  • SPSS Clementine rendszer bemutatása. Táblázatos adatmodell, @function rendszer bemutatása, adatfeldolgozási módszerek, számlálózás, címkézés. Modellezési technikák, modell fogalma, modell visszahelyezés.

     

  • SPSS Clementine szerver – kliens architektúra, SQL pushback módszerek, memóriagazdálkodás, szkript nyelve és kifejezőereje

     

  • SPSS Clementine CLEF architektúra, új csomópontok behelyezésének kérdése, létező kiegészítések bemutatása, Webmining modul bemutatása

     

  • Oracle Data Mining, Oracle Data Miner, alkalmazás architektúra, adatfilozófia. Skálázható modellezési technikák (O-Cluster, nemnegatív mátrix felbontás, szupport vektor gépek, stb.). Teljesítmény és performancia kérdések, kifejezőerő.

     

  • SAS üzleti intelligencia megoldások, SAS rendszer architektúrája, SAS Enterprise Miner és a SAS Base rendszer kapcsolata, programnyelvének bemutatása

     

  • SAS Enterprise Miner adatbányászati metodikája (SEMMA), adatmodellje, modellezési technikáinak rövid bemutatása és értékelése

     

  • Eddig ismertetett rendszerek és metodikák összehasonlítása, egymáshoz való viszonya. További eszközök rövid bemutatása

Laboratóriumi foglalkozások tematikája:

  • Több tipikus feladatot fogalmazunk meg, amit különböző adatelőkészítési és modellezési technikával oldunk meg a különböző adatbányászati szoftverekkel. A labor során a következő szoftverekkel ismerkednek meg a hallgatók:
    • WEKA
    • SPSS Clementine
    • Oracle Data Mining
    • SAS Enterprise Miner
  • A labor célja, hogy valós adathalmazok felett szerezzenek a hallgatók elemzői tapasztalatokat, illetve hogy az otthoni feladat megoldásához szükséges alapvető szoftverkezelési gyakorlatot megszerezzék.

     

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Heti 90 perc előadás és heti 90 perc laboratórium

 

10. Követelmények a. A szorgalmi időszakban: Zárthelyi dolgozat és otthoni feladat elkészítése

 

b. A vizsgaidőszakban: Vizsga

 

c. Elővizsga: Van

 

 

 

11. Pótlási lehetőségek A TVSz-ben meghatározott módon megfelelő számú pótZH, gyakIV, késői otthoni feladat beadás

 

12. Konzultációs lehetőségek Laborgyakorlatok során

 

13. Jegyzet, tankönyv, felhasználható irodalom
  • Dr. Abonyi János: Adatbányászat a hatékonyság eszköze, Computerbooks, Budapest 2006

     

  • Larose, Daniel T., Discovering Knowledge in Data: An Introduction to Data Mining, Wiley-Interscience, 2004.
  • A szoftvercsomagokhoz tartozó dokumentációk
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra56
Félévközi készülés órákra15
Felkészülés zárthelyire10
Házi feladat elkészítése24
Kijelölt írásos tananyag elsajátítása 0
Vizsgafelkészülés15
Összesen120
15. A tantárgy tematikáját kidolgozta
Név:

 

Beosztás:

 

Tanszék, Int.:

 

Gáspár-Papanek Csaba

 

Ügyvivő szakértő

 

TMIT