Matematikai statisztika (Doktori)

A VIK Wikiből
Matematikai statisztika
Tárgykód
VISZD302
Általános infók
Szak
villany doktori
Kredit
5
Ajánlott félév
1
Tanszék
SZIT
Követelmények
Jelenlét
nincs
NagyZH
2 db
Házi feladat
a két ZH kiváltható egy nagy házi feladattal
Vizsga
szóbeli
Elérhetőségek

Rövid ismertető

A tantárgy célja, hogy bevezetést nyújtson a statisztika matematikai elméletébe és alkalmazásaiba, és ezáltal a hallgatóknak kellő áttekintést adjon azokról a módszerekről, melyeket a gyakorlati adatelemzésben használhatnak. A valószínűségszámítási háttér és az alapvető fogalmak (statisztikai becslés, hipotézisvizsgálat, modellillesztés) tisztázása után sorra megvizsgáljuk a különböző módszereket, egyenlő hangsúlyt fektetve az eljárások matematikai hátterének tisztázására és a konkrét gyakorlati kivitelezésére. Az általános elveket számos példával illusztráljuk, továbbá az SPSS programcsomag segítségével begyakoroljuk.

Tematika

  • Paraméterbecslések. Alapfogalmak: minta, statisztika, paraméter példák. Mintavételi technikák. A szükséges mintaelemszám meghatározása. A matematikai statisztika alaptétele. Torzítatlan, konzisztens, hatásos, elégséges becslés. Cramer-Rao-egyenlőtlenség. Neyman-Fisher faktorizációs tétel. Rao-Blackwell-Kolmogorov-tétel. Maximum likelihood-módszer és a momentumok módszere. Cramer-Dugue-tétel. A normális eloszlásból származtatott eloszlások: chi-négyzet, Student- és Fisher- eloszlások. Lukács-tétel. Konfidencia-intervallumok.
  • Statisztikai hipotézisvizsgálat. Hipotézisek., próbastatisztika, kritikus tartomány. Első- és másodfajú hibavalószínűség. Neyman-Pearson és a Stein Lemma. Erőfüggvény, a próba konzisztenciája, torzítatlansága és ereje. u-próbák, t-próbák, Welch-próba, F-próba. Függetlenség- és homogenitásvizsgálat: chi-négyzet próbák, Kolmogorov-Szmirnov próbák. Kolmogorov- és Gnyegyenko-Koroljuk-tétel.
  • Lineáris regresszió. Regressziófüggvény. Lineáris regresszió, polinomiális regresszió, lineárisra visszavezethető kétparaméteres regressziók. A legkisebb négyzetek módszere. Gauss-Markov-tétel. Többváltozós lineáris regresszió. Modellépítési technikák: stepwise, backwise, foreward. Korrelációs együtthatók: totális-, többszörös-, parciális-. Sztochasztikus approximáció.
  • Nem-paraméteres eloszlás- és sűrűségfüggvény-becslés. Eloszlásfüggvény becslése. Szmirnov-, Kolmogorov- és Glivenko-Cantelli-tételei. A Hoeffding-egyenlőtlenség. Vapnik-Cservonenkis elmélet. Sűrűségfüggvények becslésének L1 elmélete. Scheffé-tétel. Hisztogram. Magfüggvényes becslés. Lokális átlagoláson alapuló becslők. Azuma-Hoeffding-tétel. McDiarmid-tétel.
  • Nem-paraméteres regressziófüggvény-becslés. Négyzetes hiba. Partíciós, magfüggvényes, legközelebbi szomszéd becslés. Empirikus hibaminimalizálás.
  • Alakfelismerés. Hibavalószínűség. Bayes döntés és közelítése. Partíciós, magfüggvényes, legközelebbi szomszéd osztályozás. Lokális többségen alapuló döntések. Empirikus hibaminimalizálás.
  • Faktor- és főkomponensanalízis. A Kaiser-Meyer-Olkin statisztika és a minta-alkalmassági mérték (MSA). A Bartlett-féle szfericitási-próba. A k-faktoros modell. Kummunalitás, a faktorok számának meghatározása. Forgatások: varimax, equamax, quartimax. A faktorok interpretálása. Watanabe-tétel.
  • Klaszteranalízis. A metrikus tér, metrikafüggvények. Dinamikus és hierarchikus módszer: a k-közép módszer, agglomeratív klaszterezés. McQueen-tétel.
  • Diszkriminanciaanalízis. Tananyag, a tananyag előkészítése. Tanulóalgoritmusok. A legközelebbi társ módszere, a legközelebbi k-társ módszere. Szeparálás potenciálfüggvényekkel. ROC görbék.
  • Többdimenziós skálázás. A skálák megbízhatósága. A klasszikus MDS modellje. Nemmetrikus módszerek, a Shepard-Kruskal-algoritmus. S-tress és stress mérőszámok. Több kísérleti személy eredményeinek együttes kiértékelése.
  • Az SPSS-programrendszer alapjai (laborgyakorlatokon). Alapfogalmak: adatmátrix, változó, eset, adatszint, adattípus, hiányzó adat. Változók szerkesztése a variable üzemmódban. Adatok bevitele, szerkesztése. Leíró statisztikák (átlag, szórás, medián, módusz, ferdeség, lapultság, hisztogram, korrelációs együtthatók), grafikonok (torta, oszlop, vonal, dobozábra, P-P és Q-Q ábrák, pontfelhő-diagramok) .Adatkonverzió, adattisztítás, szűrés, rendezés. A menürendszer elemei: File, Edit, Data, Transform, Graphs. Az Analyze menü: Descriptives, Compare Means, Regressions, Classify, Data reduction, Nonparametric Tests parancsok részletei. Az output navigator (viewer) használata, a táblázatok, grafikonok átszervezése. Pivot-táblák kezelése. A programrendszer telepítése és licenszelése. Az SPSS programozása, a syntax-ablak kezelése.

ZH

A félév során két zárthelyit kell teljesíteni minimum 40%-ra külön-külön.

  • 1. ZH - Kézzel számolós feladatok: paraméteres próbák (u, t, F, párosított/független mintások), homogenitásvizsgálat, tiszta illeszkedés vizsgálat eloszlással
  • 2. ZH - SPSS számítógépes ZH: komplexebb feladatok, főkomponens analízis, illeszkedés vizsgálat, faktor analízis, klaszterezés stb.

2. ZH

Egy megoldott második ZH (számítógépes)

Vizsga

A szóbeli a kiadott tételsor alapján történik, mindenki húz egy tételt és azt kidolgozza, van rá bőven idő. Általában igen jó jegyek születnek (4-5), az oktató elsősorban arra kíváncsi, hogy érted-e átlátod-e az anyagot, tudod-e, hogy mi mit befolyásol, mit hogyan küszöbölnél ki stb. Egyszóval szemléletközpontú a vizsgáztatás, és nem a képletekre megy rá. Tisztességes felkészüléssel 2-3 nap alatt megfelelően fel lehet készülni, jó jegyet lehet szerezni.

Segédanyagok