Adatbányászati alkalmazások

A tantárgy angol neve: Data Mining Applications

Adatlap utolsó módosítása: 2009. november 12.

Tantárgy lejárati dátuma: 2015. június 30.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Mérnök informatikus szak

Villamosmérnöki szak

Szabadon választható tantárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VITMJV16   2/0/0/v 2  
3. A tantárgyfelelős személy és tanszék Dr. Henk Tamás,
4. A tantárgy előadója
 Név: Beosztás: Tanszék, Intézet:
 Gáspár-Papanek Csaba egy. tanársegéd TMIT
5. A tantárgy az alábbi témakörök ismeretére épít

Algoritmuselméleti alapok

6. Előtanulmányi rend
Kötelező:
NEM ( TárgyTeljesítve("BMEVITMAV16") )

A fenti forma a Neptun sajátja, ezen technikai okokból nem változtattunk.

A kötelező előtanulmányi rendek grafikus formában itt láthatók.

Ajánlott:

Nincs.

Nem vehetik fel, akik hallgatták a vitmav16 (Adatbányászati alkalmazások) tárgyat

7. A tantárgy célkitűzése

A tárgy célja, hogy a hallgató számára felvázolja az algoritmikus adatbányászat alkalmazási módszereit, ezáltal olyan gondolkodásmódot adjon a hallgatónak, aki maga is képes lesz az adatbányászat alkalmazhatóságát egy-egy területen felismerni. A tárgy nem az algoritmusok működésére, hanem azok rendszerszintű használatára fókuszál.

8. A tantárgy részletes tematikája

1. hét

Bevezetés a tudásfeltárás folyamatába, az adatbányászat kialakulását indukáló körülmények, vásárlói kosár modell ismertetése, termékhalmaz gyakorisága, asszociációs szabály intuitív bevezetése, mohó eljárás és hatékonyságának vizsgálata.

2. hét

Mohó algoritmus továbbfejlesztése gyakori termékhalmazok keresésére, szintenként haladó eljárás, APRIORI elv és felhasználása, jelöltállítás és törlés, APRIORI algoritmus felvázolása, leállási feltételei. Asszociációs szabályok formális bevezetése. Adatbányászat definíciója, összevetés más tudományterületekkel. Alkalmazási területek hipermarketekben, bevásárlói kártyák, gyakori szekvenciák fogalma.

3. hét

CRISP-DM metodika bevezetése, lépései. Távközlési területen használt adatbányászati megoldások, lemorzsolódás CRISP-DM alapú bemutatása, adatforrások, adatminőség, adatelőkészítés, modellezési igény, osztályozási feladat bevezetése, döntési fák.

4. hét

Ügyfélszegmentáció, klaszterezés irányelvei és célfüggvénye, szegmentáció a távközlési területen. Klaszterezés és az osztályozás összevetése. Kapcsolati hálók elemzésének lehetőségei. K-közép és K-medoid eljárások bevezetése, tulajdonságaik. Klaszterek értelmezése osztályozási technikákkal.

5. hét

Üzleti intelligencia és az adatbányászat kapcsolata. Adatbányászati alkalmazások banki és biztosítói környezetben. Regressziós technikák és a regresszió alapfeladatának összevetése a klaszterezéssel és az osztályozással. Scorecardok, hitelbírálat. Hitelbírálat speciális adattorzulási környezetének eliminálása.

6. hét

Webes adatbányászati alkalmazások. A webes alkalmazhatóság három területének áttekintése, webes adatforrások, adatminőség, adatelőkészítés, felhasználó azonosítás kérdései. Mintakeresés weblog adatokban. Felhasználó-viselkedés elemzése.

7. hét

Adatbányászati és üzleti intelligencia piac áttekintése, trendek bemutatás. Sikeres adatbányászat kritériumai, az eddig bemutatott területek alkalmassága. Modellezés eredményének visszamérése, találati pontosság, megbízhatósági érték, ROC görbe, AUC.

8. hét

Zh írás

Adatbányászati szoftverek és szoftverszállítók, piaci körkép, eszközök képességeinek rövid bemutatása, költségek, integrálhatóság.

9. hét

Ajánlattevő rendszerek alapjainak áttekintése, tartalom alapú és felhasználói szokásokon alapuló rendszerek összevetése. Az ajánlattevő rendszereknél felmerülő adatbányászati problémák (hidegindítás, beszűkülés stb.) bemutatása. Feature selection és extraction módszerek.

10. hét

Nyomkövetés és beltéri helymeghatározás adatbányászati kérdései. Az RFID technológia alapjainak ismertetése, és felhasználási lehetőségei. Pozícionálási algoritmusok. A k legközelebbi szomszéd algoritmus, dimenziók átka.

11. hét

Tőzsdei adatok elemzése, idősorok adatbányászatának aspektusai. Perceptron modell. Neurális hálózatok alapjainak áttekintése, négyzetes hibafüggvény és gradiens módszerek, a neurális hálózatok összevetése az eddig bemutatott osztályozó módszerekkel.

12. hét

Együttes osztályozó rendszerek, bagging és boosting technikák, szavazó stratégiák bemutatása. Orvosi adatok elemzése adatbányászati módszerekkel (esettanulmány).

13. hét

Esettanulmányok bemutatása a CRISP-DM módszertan lépésein keresztül: gyalogos-felismerés képek alapján, gesztusfelismerés mobilba épített gyorsulásmérő segítségével.

14. hét

Zh pótlás, elővizsga

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium)

Előadás

10. Követelmények
  • A szorgalmi időszakban: 1 zárthelyi dolgozat
  • A vizsgaidőszakban: írásbeli vizsga alkalmak, szóbeli javítási lehetőség
  • Elővizsga az utolsó órán
11. Pótlási lehetőségek

Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.

12. Konzultációs lehetőségek

Igény szerint, az oktatóval egyeztetve.

13. Jegyzet, tankönyv, felhasználható irodalom
  1. Abonyi János (szerk.): Adatbányászat a hatékonyság eszköze. Budapest, 2006, Computerbooks. ISBN: 963-618-342-2
  2. Bodon Ferenc: Adatbányászati algoritmusok (elektronikusan elérhető jegyzet), 2009. http://www.cs.bme.hu/~bodon/magyar/index.html
  3. Daniel T. Larose: Discovering Knowledge in Data: An Introduction to Data Mining. 2004, Wiley-Interscience. ISBN: 0-471-66657-2
14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
Kontakt óra28
Félévközi készülés órákra10
Felkészülés zárthelyire11
Házi feladat elkészítése -
Kijelölt írásos tananyag elsajátítása -
Vizsgafelkészülés11
Összesen60
15. A tantárgy tematikáját kidolgozta
 Név: Beosztás: Tanszék, Intézet:
 Dr. Henk Tamás egy. docens TMIT
 Gáspár-Papanek Csaba egy. tanársegéd TMIT