Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Adatbányászati alkalmazások

    A tantárgy angol neve: Data Mining Applications

    Adatlap utolsó módosítása: 2009. november 12.

    Tantárgy lejárati dátuma: 2015. június 30.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Mérnök informatikus szak

    Villamosmérnöki szak

    Szabadon választható tantárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VITMJV16   2/0/0/v 2  
    3. A tantárgyfelelős személy és tanszék Dr. Henk Tamás,
    4. A tantárgy előadója
     Név: Beosztás: Tanszék, Intézet:
     Gáspár-Papanek Csaba egy. tanársegéd TMIT
    5. A tantárgy az alábbi témakörök ismeretére épít

    Algoritmuselméleti alapok

    6. Előtanulmányi rend
    Kötelező:
    NEM ( TárgyTeljesítve("BMEVITMAV16") )

    A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

    A kötelező előtanulmányi rendek grafikus formában itt láthatók.

    Ajánlott:

    Nincs.

    Nem vehetik fel, akik hallgatták a vitmav16 (Adatbányászati alkalmazások) tárgyat

    7. A tantárgy célkitűzése

    A tárgy célja, hogy a hallgató számára felvázolja az algoritmikus adatbányászat alkalmazási módszereit, ezáltal olyan gondolkodásmódot adjon a hallgatónak, aki maga is képes lesz az adatbányászat alkalmazhatóságát egy-egy területen felismerni. A tárgy nem az algoritmusok működésére, hanem azok rendszerszintű használatára fókuszál.

    8. A tantárgy részletes tematikája

    1. hét

    Bevezetés a tudásfeltárás folyamatába, az adatbányászat kialakulását indukáló körülmények, vásárlói kosár modell ismertetése, termékhalmaz gyakorisága, asszociációs szabály intuitív bevezetése, mohó eljárás és hatékonyságának vizsgálata.

    2. hét

    Mohó algoritmus továbbfejlesztése gyakori termékhalmazok keresésére, szintenként haladó eljárás, APRIORI elv és felhasználása, jelöltállítás és törlés, APRIORI algoritmus felvázolása, leállási feltételei. Asszociációs szabályok formális bevezetése. Adatbányászat definíciója, összevetés más tudományterületekkel. Alkalmazási területek hipermarketekben, bevásárlói kártyák, gyakori szekvenciák fogalma.

    3. hét

    CRISP-DM metodika bevezetése, lépései. Távközlési területen használt adatbányászati megoldások, lemorzsolódás CRISP-DM alapú bemutatása, adatforrások, adatminőség, adatelőkészítés, modellezési igény, osztályozási feladat bevezetése, döntési fák.

    4. hét

    Ügyfélszegmentáció, klaszterezés irányelvei és célfüggvénye, szegmentáció a távközlési területen. Klaszterezés és az osztályozás összevetése. Kapcsolati hálók elemzésének lehetőségei. K-közép és K-medoid eljárások bevezetése, tulajdonságaik. Klaszterek értelmezése osztályozási technikákkal.

    5. hét

    Üzleti intelligencia és az adatbányászat kapcsolata. Adatbányászati alkalmazások banki és biztosítói környezetben. Regressziós technikák és a regresszió alapfeladatának összevetése a klaszterezéssel és az osztályozással. Scorecardok, hitelbírálat. Hitelbírálat speciális adattorzulási környezetének eliminálása.

    6. hét

    Webes adatbányászati alkalmazások. A webes alkalmazhatóság három területének áttekintése, webes adatforrások, adatminőség, adatelőkészítés, felhasználó azonosítás kérdései. Mintakeresés weblog adatokban. Felhasználó-viselkedés elemzése.

    7. hét

    Adatbányászati és üzleti intelligencia piac áttekintése, trendek bemutatás. Sikeres adatbányászat kritériumai, az eddig bemutatott területek alkalmassága. Modellezés eredményének visszamérése, találati pontosság, megbízhatósági érték, ROC görbe, AUC.

    8. hét

    Zh írás

    Adatbányászati szoftverek és szoftverszállítók, piaci körkép, eszközök képességeinek rövid bemutatása, költségek, integrálhatóság.

    9. hét

    Ajánlattevő rendszerek alapjainak áttekintése, tartalom alapú és felhasználói szokásokon alapuló rendszerek összevetése. Az ajánlattevő rendszereknél felmerülő adatbányászati problémák (hidegindítás, beszűkülés stb.) bemutatása. Feature selection és extraction módszerek.

    10. hét

    Nyomkövetés és beltéri helymeghatározás adatbányászati kérdései. Az RFID technológia alapjainak ismertetése, és felhasználási lehetőségei. Pozícionálási algoritmusok. A k legközelebbi szomszéd algoritmus, dimenziók átka.

    11. hét

    Tőzsdei adatok elemzése, idősorok adatbányászatának aspektusai. Perceptron modell. Neurális hálózatok alapjainak áttekintése, négyzetes hibafüggvény és gradiens módszerek, a neurális hálózatok összevetése az eddig bemutatott osztályozó módszerekkel.

    12. hét

    Együttes osztályozó rendszerek, bagging és boosting technikák, szavazó stratégiák bemutatása. Orvosi adatok elemzése adatbányászati módszerekkel (esettanulmány).

    13. hét

    Esettanulmányok bemutatása a CRISP-DM módszertan lépésein keresztül: gyalogos-felismerés képek alapján, gesztusfelismerés mobilba épített gyorsulásmérő segítségével.

    14. hét

    Zh pótlás, elővizsga

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

    Előadás

    10. Követelmények
    • A szorgalmi időszakban: 1 zárthelyi dolgozat
    • A vizsgaidőszakban: írásbeli vizsga alkalmak, szóbeli javítási lehetőség
    • Elővizsga az utolsó órán
    11. Pótlási lehetőségek

    Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.

    12. Konzultációs lehetőségek

    Igény szerint, az oktatóval egyeztetve.

    13. Jegyzet, tankönyv, felhasználható irodalom
    1. Abonyi János (szerk.): Adatbányászat a hatékonyság eszköze. Budapest, 2006, Computerbooks. ISBN: 963-618-342-2
    2. Bodon Ferenc: Adatbányászati algoritmusok (elektronikusan elérhető jegyzet), 2009. http://www.cs.bme.hu/~bodon/magyar/index.html
    3. Daniel T. Larose: Discovering Knowledge in Data: An Introduction to Data Mining. 2004, Wiley-Interscience. ISBN: 0-471-66657-2
    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra28
    Félévközi készülés órákra10
    Felkészülés zárthelyire11
    Házi feladat elkészítése -
    Kijelölt írásos tananyag elsajátítása -
    Vizsgafelkészülés11
    Összesen60
    15. A tantárgy tematikáját kidolgozta
     Név: Beosztás: Tanszék, Intézet:
     Dr. Henk Tamás egy. docens TMIT
     Gáspár-Papanek Csaba egy. tanársegéd TMIT