Budapest University of Technology and Economics, Faculty of Electrical Engineering and Informatics

    Belépés
    címtáras azonosítással

    vissza a tantárgylistához   nyomtatható verzió    

    Matematikai statisztika

    A tantárgy angol neve: Mathematical Statistics

    Adatlap utolsó módosítása: 2009. március 10.

    Budapesti Műszaki és Gazdaságtudományi Egyetem
    Villamosmérnöki és Informatikai Kar

    Villamosmérnöki Szak

    Műszaki Informatika Szak

    Doktorandusz tárgy

    Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
    VISZD302   4/0/0/v 5 1/1
    3. A tantárgyfelelős személy és tanszék Dr. Győrfi László, Számítástudományi és Információelméleti Tanszék
    4. A tantárgy előadója
    Név:Beosztás:Tanszék, Int.:
    Dr. Györfi Lászlóegyetemi tanárSzámítástudományi és Információelméleti Tanszék
    Dr. Ketskeméty Lászlóegyetemi docens Számítástudományi és Információelméleti Tanszék
    5. A tantárgy az alábbi témakörök ismeretére épít Valószínűségszámítás
    6. Előtanulmányi rend
    Ajánlott:
    ----
    7. A tantárgy célkitűzése A tantárgy célja, hogy bevezetést nyújtson a statisztika matematikai elméletébe és alkalmazásaiba, és ezáltal a hallgatóknak kellő áttekintést adjon azokról a módszerekről, melyeket a gyakorlati adatelemzésben használhatnak. A valószínűségszámítási háttér és az alapvető fogalmak (statisztikai becslés, hipotézisvizsgálat, modellillesztés) tisztázása után sorra megvizsgáljuk a különböző módszereket, egyenlő hangsúlyt fektetve az eljárások matematikai hátterének tisztázására és a konkrét gyakorlati kivitelezésére. Az általános elveket számos példával illusztráljuk, továbbá az SPSS programcsomag segítségével begyakoroljuk.
    8. A tantárgy részletes tematikája a.  Paraméterbecslések.  Alapfogalmak: minta, statisztika, paraméter példák. Mintavételi technikák. A szükséges mintaelemszám meghatározása. A matematikai statisztika alaptétele. Torzítatlan, konzisztens, hatásos, elégséges becslés. Cramer-Rao-egyenlőtlenség. Neyman-Fisher faktorizációs tétel. Rao-Blackwell-Kolmogorov-tétel. Maximum likelihood-módszer és a momentumok módszere. Cramer-Dugue-tétel.  A normális eloszlásból származtatott eloszlások: chi-négyzet, Student- és Fisher- eloszlások. Lukács-tétel.  Konfidencia-intervallumok.

     

    b. Statisztikai hipotézisvizsgálat. Hipotézisek., próbastatisztika, kritikus tartomány. Első- és másodfajú hibavalószínűség. Neyman-Pearson és a Stein Lemma. Erőfüggvény, a próba konzisztenciája, torzítatlansága és ereje. u-próbák, t-próbák, Welch-próba, F-próba. Függetlenség- és homogenitásvizsgálat: chi-négyzet próbák, Kolmogorov-Szmirnov próbák. Kolmogorov- és Gnyegyenko-Koroljuk-tétel.

     

    c. Lineáris regresszió. Regressziófüggvény. Lineáris regresszió, polinomiális regresszió, lineárisra visszavezethető kétparaméteres regressziók. A legkisebb négyzetek módszere.  Gauss-Markov-tétel. Többváltozós lineáris regresszió. Modellépítési technikák: stepwise, backwise, foreward.  Korrelációs együtthatók: totális-, többszörös-, parciális-. Sztochasztikus approximáció.

     

    d. Nem-paraméteres eloszlás- és sűrűségfüggvény-becslés. Eloszlásfüggvény becslése. Szmirnov-, Kolmogorov- és Glivenko-Cantelli-tételei. A Hoeffding-egyenlőtlenség.  Vapnik-Cservonenkis elmélet. Sűrűségfüggvények becslésének L1 elmélete. Scheffé-tétel.  Hisztogram. Magfüggvényes becslés. Lokális átlagoláson alapuló becslők. Azuma-Hoeffding-tétel. McDiarmid-tétel.

     

    e.  Nem-paraméteres regressziófüggvény-becslés. Négyzetes hiba. Partíciós,  magfüggvényes, legközelebbi szomszéd becslés. Empirikus hibaminimalizálás.

     

    f.  Alakfelismerés. Hibavalószínűség. Bayes döntés és közelítése. Partíciós,  magfüggvényes, legközelebbi szomszéd osztályozás. Lokális többségen alapuló döntések. Empirikus hibaminimalizálás.

     

    g. Faktor- és főkomponensanalízis.  A Kaiser-Meyer-Olkin statisztika és a minta-alkalmassági mérték (MSA). A Bartlett-féle szfericitási-próba.  A k-faktoros modell. Kummunalitás, a faktorok számának meghatározása. Forgatások: varimax, equamax, quartimax.  A faktorok interpretálása. Watanabe-tétel.

     

    h.  Klaszteranalízis.  A metrikus tér, metrikafüggvények. Dinamikus és hierarchikus módszer: a k-közép módszer, agglomeratív klaszterezés. McQueen-tétel.

     

    i. Diszkriminanciaanalízis. Tananyag, a tananyag előkészítése. Tanulóalgoritmusok. A legközelebbi társ módszere, a legközelebbi k-társ módszere. Szeparálás potenciálfüggvényekkel. ROC görbék.

     

    j.  Többdimenziós skálázás.  A skálák megbízhatósága. A klasszikus MDS modellje. Nemmetrikus módszerek, a Shepard-Kruskal-algoritmus. S-tress és stress mérőszámok. Több kísérleti személy eredményeinek együttes kiértékelése.

     

    k.  Az SPSS-programrendszer alapjai (laborgyakorlatokon). Alapfogalmak: adatmátrix, változó, eset, adatszint, adattípus, hiányzó adat. Változók szerkesztése a variable üzemmódban. Adatok bevitele, szerkesztése. Leíró statisztikák (átlag, szórás, medián, módusz, ferdeség, lapultság, hisztogram, korrelációs együtthatók), grafikonok (torta, oszlop, vonal, dobozábra, P-P és Q-Q ábrák, pontfelhő-diagramok) .Adatkonverzió, adattisztítás, szűrés, rendezés. A menürendszer elemei: File, Edit, Data, Transform, Graphs. Az Analyze menü: Descriptives, Compare Means, Regressions, Classify, Data reduction, Nonparametric Tests parancsok részletei. Az output navigator (viewer) használata, a táblázatok, grafikonok átszervezése. Pivot-táblák kezelése. A programrendszer telepítése és licenszezése.  Az SPSS programozása, a syntax-ablak kezelése. 

     

     

    9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium) előadás és laboratórium
    10. Követelmények

    A szorgalmi időszakban: HF elkészítése az SPSS-sel
    A vizsgaidőszakban:  szóbeli vizsga 

    11. Pótlási lehetőségek

    Ha a hallgató nem tud bejárni az előadásokra, akkor javasoljuk, hogy beszélje meg az előadókkal az egyéni felkészülés lehetőségeit.

    12. Konzultációs lehetőségek Az előadókkal történő egyéni egyeztetés alapján.
    13. Jegyzet, tankönyv, felhasználható irodalom

    a.   Bevezetés a matematikai statisztikába. (Szerk.: Fazekas I.) Egyetemi jegyzet. Kossuth Lajos Tudományegyetem, Debrecen (1997)

    b. Ketskeméty, Pintér: Bevezetés a matematikai statisztikába.  Egyetemi jegyzet. www.szit.bme.hu/~kela/ind3.html

    c. Ketskeméty, Izsó: Bevezetés az SPSS programrendszerbe.  ELTE Eötvös Kiadó, 2005.

    d. Vincze: Matematikai statisztika ipari alkalmazásokkal.

    14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

    Kontakt óra

    60
    Félévközi készülés órákra15
    Felkészülés a laborra10
    Házi feladat elkészítése5
    Kijelölt írásos tananyag elsajátítása
    Vizsgafelkészülés40
    Összesen
    (a tantárgyhoz tartozó tanulmányi idő körülbelüli felosztása a tanórák, továbbá a házi feladatok és a zárthelyik között (a felkészülésre, ill. a kidolgozásra átlagosan fordítandó/elvárható idők félévi munkaórában, kredit x 30 óra, pl. 5 kredit esetén 150 óra)):

     

     

    15. A tantárgy tematikáját kidolgozta

    Dr. Ketskeméty László

     

    egyetemi docens

     

    Számítástudományi és Információelméleti Tanszék