Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Intelligens adatelemzés

    A tantárgy angol neve: Intelligent Data Analysis

    Adatlap utolsó módosítása: 2009. november 20.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Mesterképzés (MSc):

    egészségügyi mérnöki szak

    mérnök informatikus szak

    villamosmérnöki szak

    Intelligens rendszerek szakirány (MIT)

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VIMIM328 3 2/1/0/v 4  
    3. A tantárgyfelelős személy és tanszék Dr. Antal Péter, Méréstechnika és Információs Rendszerek Tanszék
    4. A tantárgy előadója Dr. Antal Péter, egyetemi adjunktus
    5. A tantárgy az alábbi témakörök ismeretére épít Valószínűségszámítás, Mesterséges Intelligencia
    6. Előtanulmányi rend
    Ajánlott:
    Ajánlott:

    Mesterséges intelligencia

    7. A tantárgy célkitűzése A statisztikai adatelemzést az adatok mennyiségének és a számítási kapacitásnak a növekedése mellett a következő tényezők is új területekkel gazdagították:

     

    • az adatok heterogenitásának növekedése, a korábban domináns passzív, strukturálatlan megfigyeléses adat mellett, egyre nagyobb szerepet kap az aktív beavatkozásból származó és strukturált adat

       

    • az elektronikusan elérhető háttértudás növekedése, az a priori ismeretek szakértőtől származó beszerzését felváltják az elektronikus forrásokból származtatott ismeretek

       

    • a modellek komplexitásának növekedése, a korábbi függvényapproximációs és eloszlásmodellezős szemlélet mellett egyre nagyobb hangsúlyt kap a dekomponált, hierarchikus (relációs/objektum-orientált) modelleknek  a tanulása, illetve oksági modellek tanulása, beavatkozásokhoz tartozó és kontra-faktuális valószínűségek következtetése

       

    • és a feltett kérdések szemantikai jellegének a növekedése, a korábbi predikciós és teljes modell tanulását célzó módszerek mellett, egyre nagyobb szerepet kapnak a modell jegyeinek, szemantikus tulajdonságainak a tanulása, különös tekintettel a háttértudás felhasználására a kérdések megfogalmazásában

       

    • a bayes statisztikai megközelítés előtérbe kerülése, ami a számítási kapacitás, az elektronikusan elérhető a priori ismeretek, a modellek és a kérdések komplexitásának növekedésének is következménye.

       

     

    Ezek az új területek összefoglalóan egy tudás és számítás intenzív bayes statisztikai keretben helyezhetők el, ami tehát komplex adatoknak, ismereteknek, modelleknek és kérdéseknek a statisztikai elemzését kínálja.

     

    8. A tantárgy részletes tematikája

     

    • Bevezetés. A statisztikai adatok sokfélesége. Az indukció valószínűségi megközelítése. Klasszikus és bayesi statisztika célkitűzései, metodológiája. Alapfogalmak bemutatása egy változós normális eloszlás esetén, parallel fogalmak összehasonlítása és komplex valószínűségi modellek esetén. A valószínűségi következtetések típusai: megfigyeléses, beavatkozásos, kontra-faktuális.

       

    • Adatok vizualizációja. Dimenzió-, topológia- és varianciamegőrző dimenzió csökkentő leképezések.

       

    • Adatok leiró statisztikai elemzése. Kluszterező módszerek. A kiértékelés és értelmezés problémája. Adatintegrálás, tudásfúzió.

       

    • A hiányos adat típusai. Hiányos adatok kezelési módszerei. Expectation-Maximization. Bayesi megközelítés.

       

    • Kismintás statisztikai módszerek. Bootstrap. Bayesi következtetés hatékony Monte Carlo módszerekkel: MC, MCMC, MCMCMC, ....

       

    • Feltételes modellek tanulása és használata hiányos adat esetén kiegészítő modellekkel.

       

    • Kiterjesztett Bayes hálók. Monolitikus Bayes hálók. Oksági Bayes hálók. Hierarchikus és dekomponált Bayes hálók, objektum orientált Bayes hálók,  dinamikus Bayes hálók, rejtett Markov modellek.

       

    • Bayes hálók tanulása és értelmezése.

       

    • Bayes hálók tanulása hiányos adatok és beavatkozásos adatok esetén.

       

    • Bayesi következtetés Bayes hálók tulajdonságairól.

       

    • Tanulás logikai reprezentációkban. Induktív logikai programozás.    A tudás szerepe a tanulásban. Magyarázat alapú tanulás.

       

    • Sztochasztikus nyelvtanok. Rejtett Markov modellek és sztochasztikus nyelvtanok kapcsolata. Nyelvtanok tanulása.

       

    • Alkalmazások. Biológiai szekvenciák elemzése. Orvosbiológiai oksági modellek tanulása megfigyelési és beavatkozási adatok együtteséből.

       

    •  ‘Szövegbányászat’-i módszerek és információ keresés. Relációk automatikus kivonatolása szintaktikai (nyelvészeti) és statisztikai módszerekkel. Szakirodalmi hálók és tudásbázisok automatikus építése. A szövegbányászat eredményeinek felhasználása a statisztikai adatelemzésben.

       

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) Előadás
    10. Követelmények

    a. A szorgalmi időszakban:

    · félév közben (kb. 8-9. héten) egy nagy ZH (max. pontszám 50), a szükséges minimum szint a pontok 40%-a.

    b. pótlási héten: elővizsga igény szerint.

     b. A vizsgaidőszakban: írásbeli vizsga. A vizsgára bocsátás feltétele az évközi ZH minimális (40 %) szintű teljesítése.

    c. Osztályozás:

    A vizsga osztályzata a vizsgaeredmény alapján kerül megállapításra.  

     

     

    11. Pótlási lehetőségek

    Sikertelen zárthelyi a szorgalmi időszakban a pótzárthelyin pótolható. A sikertelen (pót)zárthelyi a pótlási héten különeljárási díj ellenében egy további alkalommal pótolható.

    Javítás esetén a javító pótzárthelyi írás megkezdésekor az eredeti eredmény törlődik, mindenképpen a javító pótzh eredményét vesszük figyelembe (akár jobb, akár rosszabb az eredeti eredménynél).

    12. Konzultációs lehetőségek Igény szerint
    13. Jegyzet, tankönyv, felhasználható irodalom

    D. J. Hand: Intelligent Data Analysis
    T.Hastie, R.Tibshirani, J.Friedman: The Elements of Statistical Learning
    R. G. Cowel: Probabilistic Networks and Expert Systems
    C.M. Bishop: Neural Networks for Pattern Recognition
    R.M.Neal: Bayesian Learning for Neural Networks
    J. M. Bernardo, A. F. M. Smith: Bayesian Theory
    Andrew Gelman: Bayesian Data Analysis
    Bayesian inference Using Gibbs Sampling: http://www.mrc-bsu.cam.ac.uk/bugs/
    Learning in Graphical Models (Adaptive Computation and Machine Learning) by Michael Irwin Jordan (Editor)
    Graphical Models (Oxford Statistical Science Series, 17) by Steffen L. Lauritzen

     

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka
    Kontakt óra42
    Félévközi készülés órákra6
    Felkészülés zárthelyire16
    Házi feladat elkészítése0
    Kijelölt írásos tananyag elsajátítása8
    Vizsgafelkészülés48
    Összesen120
    15. A tantárgy tematikáját kidolgozta Antal Péter