Matematikai statisztika

A tantárgy angol neve: Mathematical Statistics

Adatlap utolsó módosítása: 2009. március 10.

Budapesti Műszaki és Gazdaságtudományi Egyetem
Villamosmérnöki és Informatikai Kar

Villamosmérnöki Szak

Műszaki Informatika Szak

Doktorandusz tárgy

Tantárgykód Szemeszter Követelmények Kredit Tantárgyfélév
VISZD302   4/0/0/v 5 1/1
3. A tantárgyfelelős személy és tanszék Dr. Gyorfi László, Számítástudományi és Információelméleti Tanszék
4. A tantárgy előadója
Név:Beosztás:Tanszék, Int.:
Dr. Györfi Lászlóegyetemi tanárSzámítástudományi és Információelméleti Tanszék
Dr. Ketskeméty Lászlóegyetemi docens Számítástudományi és Információelméleti Tanszék
5. A tantárgy az alábbi témakörök ismeretére épít Valószínűségszámítás
6. Előtanulmányi rend
Ajánlott:
----
7. A tantárgy célkitűzése A tantárgy célja, hogy bevezetést nyújtson a statisztika matematikai elméletébe és alkalmazásaiba, és ezáltal a hallgatóknak kellő áttekintést adjon azokról a módszerekről, melyeket a gyakorlati adatelemzésben használhatnak. A valószínűségszámítási háttér és az alapvető fogalmak (statisztikai becslés, hipotézisvizsgálat, modellillesztés) tisztázása után sorra megvizsgáljuk a különböző módszereket, egyenlő hangsúlyt fektetve az eljárások matematikai hátterének tisztázására és a konkrét gyakorlati kivitelezésére. Az általános elveket számos példával illusztráljuk, továbbá az SPSS programcsomag segítségével begyakoroljuk.
8. A tantárgy részletes tematikája a.  Paraméterbecslések.  Alapfogalmak: minta, statisztika, paraméter példák. Mintavételi technikák. A szükséges mintaelemszám meghatározása. A matematikai statisztika alaptétele. Torzítatlan, konzisztens, hatásos, elégséges becslés. Cramer-Rao-egyenlőtlenség. Neyman-Fisher faktorizációs tétel. Rao-Blackwell-Kolmogorov-tétel. Maximum likelihood-módszer és a momentumok módszere. Cramer-Dugue-tétel.  A normális eloszlásból származtatott eloszlások: chi-négyzet, Student- és Fisher- eloszlások. Lukács-tétel.  Konfidencia-intervallumok.

 

b. Statisztikai hipotézisvizsgálat. Hipotézisek., próbastatisztika, kritikus tartomány. Első- és másodfajú hibavalószínűség. Neyman-Pearson és a Stein Lemma. Erőfüggvény, a próba konzisztenciája, torzítatlansága és ereje. u-próbák, t-próbák, Welch-próba, F-próba. Függetlenség- és homogenitásvizsgálat: chi-négyzet próbák, Kolmogorov-Szmirnov próbák. Kolmogorov- és Gnyegyenko-Koroljuk-tétel.

 

c. Lineáris regresszió. Regressziófüggvény. Lineáris regresszió, polinomiális regresszió, lineárisra visszavezethető kétparaméteres regressziók. A legkisebb négyzetek módszere.  Gauss-Markov-tétel. Többváltozós lineáris regresszió. Modellépítési technikák: stepwise, backwise, foreward.  Korrelációs együtthatók: totális-, többszörös-, parciális-. Sztochasztikus approximáció.

 

d. Nem-paraméteres eloszlás- és sűrűségfüggvény-becslés. Eloszlásfüggvény becslése. Szmirnov-, Kolmogorov- és Glivenko-Cantelli-tételei. A Hoeffding-egyenlőtlenség.  Vapnik-Cservonenkis elmélet. Sűrűségfüggvények becslésének L1 elmélete. Scheffé-tétel.  Hisztogram. Magfüggvényes becslés. Lokális átlagoláson alapuló becslők. Azuma-Hoeffding-tétel. McDiarmid-tétel.

 

e.  Nem-paraméteres regressziófüggvény-becslés. Négyzetes hiba. Partíciós,  magfüggvényes, legközelebbi szomszéd becslés. Empirikus hibaminimalizálás.

 

f.  Alakfelismerés. Hibavalószínűség. Bayes döntés és közelítése. Partíciós,  magfüggvényes, legközelebbi szomszéd osztályozás. Lokális többségen alapuló döntések. Empirikus hibaminimalizálás.

 

g. Faktor- és főkomponensanalízis.  A Kaiser-Meyer-Olkin statisztika és a minta-alkalmassági mérték (MSA). A Bartlett-féle szfericitási-próba.  A k-faktoros modell. Kummunalitás, a faktorok számának meghatározása. Forgatások: varimax, equamax, quartimax.  A faktorok interpretálása. Watanabe-tétel.

 

h.  Klaszteranalízis.  A metrikus tér, metrikafüggvények. Dinamikus és hierarchikus módszer: a k-közép módszer, agglomeratív klaszterezés. McQueen-tétel.

 

i. Diszkriminanciaanalízis. Tananyag, a tananyag előkészítése. Tanulóalgoritmusok. A legközelebbi társ módszere, a legközelebbi k-társ módszere. Szeparálás potenciálfüggvényekkel. ROC görbék.

 

j.  Többdimenziós skálázás.  A skálák megbízhatósága. A klasszikus MDS modellje. Nemmetrikus módszerek, a Shepard-Kruskal-algoritmus. S-tress és stress mérőszámok. Több kísérleti személy eredményeinek együttes kiértékelése.

 

k.  Az SPSS-programrendszer alapjai (laborgyakorlatokon). Alapfogalmak: adatmátrix, változó, eset, adatszint, adattípus, hiányzó adat. Változók szerkesztése a variable üzemmódban. Adatok bevitele, szerkesztése. Leíró statisztikák (átlag, szórás, medián, módusz, ferdeség, lapultság, hisztogram, korrelációs együtthatók), grafikonok (torta, oszlop, vonal, dobozábra, P-P és Q-Q ábrák, pontfelhő-diagramok) .Adatkonverzió, adattisztítás, szűrés, rendezés. A menürendszer elemei: File, Edit, Data, Transform, Graphs. Az Analyze menü: Descriptives, Compare Means, Regressions, Classify, Data reduction, Nonparametric Tests parancsok részletei. Az output navigator (viewer) használata, a táblázatok, grafikonok átszervezése. Pivot-táblák kezelése. A programrendszer telepítése és licenszezése.  Az SPSS programozása, a syntax-ablak kezelése. 

 

 

9. A tantárgy oktatásának módja (előadás, gyakorlat, laboratórium előadás és laboratórium
10. Követelmények

A szorgalmi időszakban: HF elkészítése az SPSS-sel
A vizsgaidőszakban:  szóbeli vizsga 

11. Pótlási lehetőségek

Ha a hallgató nem tud bejárni az előadásokra, akkor javasoljuk, hogy beszélje meg az előadókkal az egyéni felkészülés lehetőségeit.

12. Konzultációs lehetőségek Az előadókkal történő egyéni egyeztetés alapján.
13. Jegyzet, tankönyv, felhasználható irodalom

a.   Bevezetés a matematikai statisztikába. (Szerk.: Fazekas I.) Egyetemi jegyzet. Kossuth Lajos Tudományegyetem, Debrecen (1997)

b. Ketskeméty, Pintér: Bevezetés a matematikai statisztikába.  Egyetemi jegyzet. www.szit.bme.hu/~kela/ind3.html

c. Ketskeméty, Izsó: Bevezetés az SPSS programrendszerbe.  ELTE Eötvös Kiadó, 2005.

d. Vincze: Matematikai statisztika ipari alkalmazásokkal.

14. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka

Kontakt óra

60
Félévközi készülés órákra15
Felkészülés a laborra10
Házi feladat elkészítése5
Kijelölt írásos tananyag elsajátítása
Vizsgafelkészülés40
Összesen
(a tantárgyhoz tartozó tanulmányi idő körülbelüli felosztása a tanórák, továbbá a házi feladatok és a zárthelyik között (a felkészülésre, ill. a kidolgozásra átlagosan fordítandó/elvárható idők félévi munkaórában, kredit x 30 óra, pl. 5 kredit esetén 150 óra)):

 

 

15. A tantárgy tematikáját kidolgozta

Dr. Ketskeméty László

 

egyetemi docens

 

Számítástudományi és Információelméleti Tanszék