Matematikai statisztika (Doktori)
Rövid ismertető
A tantárgy célja, hogy bevezetést nyújtson a statisztika matematikai elméletébe és alkalmazásaiba, és ezáltal a hallgatóknak kellő áttekintést adjon azokról a módszerekről, melyeket a gyakorlati adatelemzésben használhatnak. A valószínűségszámítási háttér és az alapvető fogalmak (statisztikai becslés, hipotézisvizsgálat, modellillesztés) tisztázása után sorra megvizsgáljuk a különböző módszereket, egyenlő hangsúlyt fektetve az eljárások matematikai hátterének tisztázására és a konkrét gyakorlati kivitelezésére. Az általános elveket számos példával illusztráljuk, továbbá az SPSS programcsomag segítségével begyakoroljuk.
Tematika
- Paraméterbecslések. Alapfogalmak: minta, statisztika, paraméter példák. Mintavételi technikák. A szükséges mintaelemszám meghatározása. A matematikai statisztika alaptétele. Torzítatlan, konzisztens, hatásos, elégséges becslés. Cramer-Rao-egyenlőtlenség. Neyman-Fisher faktorizációs tétel. Rao-Blackwell-Kolmogorov-tétel. Maximum likelihood-módszer és a momentumok módszere. Cramer-Dugue-tétel. A normális eloszlásból származtatott eloszlások: chi-négyzet, Student- és Fisher- eloszlások. Lukács-tétel. Konfidencia-intervallumok.
- Statisztikai hipotézisvizsgálat. Hipotézisek., próbastatisztika, kritikus tartomány. Első- és másodfajú hibavalószínűség. Neyman-Pearson és a Stein Lemma. Erőfüggvény, a próba konzisztenciája, torzítatlansága és ereje. u-próbák, t-próbák, Welch-próba, F-próba. Függetlenség- és homogenitásvizsgálat: chi-négyzet próbák, Kolmogorov-Szmirnov próbák. Kolmogorov- és Gnyegyenko-Koroljuk-tétel.
- Lineáris regresszió. Regressziófüggvény. Lineáris regresszió, polinomiális regresszió, lineárisra visszavezethető kétparaméteres regressziók. A legkisebb négyzetek módszere. Gauss-Markov-tétel. Többváltozós lineáris regresszió. Modellépítési technikák: stepwise, backwise, foreward. Korrelációs együtthatók: totális-, többszörös-, parciális-. Sztochasztikus approximáció.
- Nem-paraméteres eloszlás- és sűrűségfüggvény-becslés. Eloszlásfüggvény becslése. Szmirnov-, Kolmogorov- és Glivenko-Cantelli-tételei. A Hoeffding-egyenlőtlenség. Vapnik-Cservonenkis elmélet. Sűrűségfüggvények becslésének L1 elmélete. Scheffé-tétel. Hisztogram. Magfüggvényes becslés. Lokális átlagoláson alapuló becslők. Azuma-Hoeffding-tétel. McDiarmid-tétel.
- Nem-paraméteres regressziófüggvény-becslés. Négyzetes hiba. Partíciós, magfüggvényes, legközelebbi szomszéd becslés. Empirikus hibaminimalizálás.
- Alakfelismerés. Hibavalószínűség. Bayes döntés és közelítése. Partíciós, magfüggvényes, legközelebbi szomszéd osztályozás. Lokális többségen alapuló döntések. Empirikus hibaminimalizálás.
- Faktor- és főkomponensanalízis. A Kaiser-Meyer-Olkin statisztika és a minta-alkalmassági mérték (MSA). A Bartlett-féle szfericitási-próba. A k-faktoros modell. Kummunalitás, a faktorok számának meghatározása. Forgatások: varimax, equamax, quartimax. A faktorok interpretálása. Watanabe-tétel.
- Klaszteranalízis. A metrikus tér, metrikafüggvények. Dinamikus és hierarchikus módszer: a k-közép módszer, agglomeratív klaszterezés. McQueen-tétel.
- Diszkriminanciaanalízis. Tananyag, a tananyag előkészítése. Tanulóalgoritmusok. A legközelebbi társ módszere, a legközelebbi k-társ módszere. Szeparálás potenciálfüggvényekkel. ROC görbék.
- Többdimenziós skálázás. A skálák megbízhatósága. A klasszikus MDS modellje. Nemmetrikus módszerek, a Shepard-Kruskal-algoritmus. S-tress és stress mérőszámok. Több kísérleti személy eredményeinek együttes kiértékelése.
- Az SPSS-programrendszer alapjai (laborgyakorlatokon). Alapfogalmak: adatmátrix, változó, eset, adatszint, adattípus, hiányzó adat. Változók szerkesztése a variable üzemmódban. Adatok bevitele, szerkesztése. Leíró statisztikák (átlag, szórás, medián, módusz, ferdeség, lapultság, hisztogram, korrelációs együtthatók), grafikonok (torta, oszlop, vonal, dobozábra, P-P és Q-Q ábrák, pontfelhő-diagramok) .Adatkonverzió, adattisztítás, szűrés, rendezés. A menürendszer elemei: File, Edit, Data, Transform, Graphs. Az Analyze menü: Descriptives, Compare Means, Regressions, Classify, Data reduction, Nonparametric Tests parancsok részletei. Az output navigator (viewer) használata, a táblázatok, grafikonok átszervezése. Pivot-táblák kezelése. A programrendszer telepítése és licenszelése. Az SPSS programozása, a syntax-ablak kezelése.
ZH
A félév során két zárthelyit kell teljesíteni minimum 40%-ra külön-külön.
- 1. ZH - Kézzel számolós feladatok: paraméteres próbák (u, t, F, párosított/független mintások), homogenitásvizsgálat, tiszta illeszkedés vizsgálat eloszlással
- 2. ZH - SPSS számítógépes ZH: komplexebb feladatok, főkomponens analízis, illeszkedés vizsgálat, faktor analízis, klaszterezés stb.
2. ZH
Egy megoldott második ZH (számítógépes)
Vizsga
A szóbeli a kiadott tételsor alapján történik, mindenki húz egy tételt és azt kidolgozza, van rá bőven idő. Általában igen jó jegyek születnek (4-5), az oktató elsősorban arra kíváncsi, hogy érted-e átlátod-e az anyagot, tudod-e, hogy mi mit befolyásol, mit hogyan küszöbölnél ki stb. Egyszóval szemléletközpontú a vizsgáztatás, és nem a képletekre megy rá. Tisztességes felkészüléssel 2-3 nap alatt megfelelően fel lehet készülni, jó jegyet lehet szerezni.
Segédanyagok
- Tételsor a szóbeli vizsgához
- Vizsgára szóbeli kidolgozás by M. - Hibák előfordulhatnak!