ZH (2014. tavasz)

Tárgykód	VITMM139
Általános infók
Szak	info MSc
Kredit	4
Ajánlott félév	1
Tanszék	TMIT
Követelmények
NagyZH	1 db
Vizsga	írásbeli
Elérhetőségek
	Tantárgyi adatlap

Naiv Bayes osztályozó
1. Milyen képleten alapul; hogyan lehet a tényezőit becsülni?
2. Hogyan alkalmazható többcímkés osztályozásra?
3. Milyen a tanulás és tesztelés időigénye, és miért?
Hogy segíthet a tokenizálásnál, ha ismert a dokumentum nyelve?
Megoldás: Ha ismert a dokumentum nyelve, akkor a tokenizáláskor figyelembe tudjuk venni az adott nyelv sajátosságait (pl. ékezetek és írásjelek használata, van-e szóköz, dátumok, mértékek használata).
Mi a szó-dokumentum mátrix használatának hátránya?
Megoldás: A mátrix nagyon nagy lehet, ezért nehéz felépíteni és a műveletek elvégzése is időigényes.
Milyen hibát véthet egy szótövező?
Megoldás:
Alultövezés: két szóhoz, melyek jelentése ekvivalens a feldolgozás szempontjából, az algoritmus két külön tövet rendel.
Túltövezés: két szóhoz, melyek jelentése különböző, az algoritmus ugyanazt a tövet rendeli.
Félreértelmezés: olyan végződést vág le az algoritmus, ami valójában a tő része.
Egy korpuszban a második leggyakrabban előforduló szó relatív gyakorisága r. Mennyi a 4. leggyakoribb szó relatív gyakorisága, ha a korpuszban előforduló szavak eloszlására igaz a Zipf-törvény (alfa = 1 esetén)?
Megoldás: Zipf törvény: $P_{n} = 1 / n^{a}$ .
2. leggyakoribb szó esetén $P_{2} = 1 / 2 = r$
4. leggyakoribb szó esetén $P_{4} = 1 / 4 = r / 2$
Melyek a szótövező eljárások 3 nagy típusa? Mutassa be őket egy-két mondatban.
Megoldás:
Algoritmikus, nyelv-specifikus átírószabályokat alkalmazó módszerek. (pl. Porter, Snowball, Lovins, stb.)
Szavakat és szótöveiket tartalmazó szótárt használó módszerek.
Egyéb eljárások, pl. statisztikai módszerek alkalmazása.
Egy osztályozó mért pontossága (presision) ⅔. Milyen határok között lehet az F1 mértéke?
Mi az a CRF és mire használható?

Ponthatárok

17-20 pont: 5
15-16 pont: 4
13-14 pont: 3
10-12 pont: 2
0-9 pont: 1

Médiainformatika - Mérnök informatikus MSc

1. félév (tavasz)	Adatbiztonság • Médiatartalom-kezelő rendszerek • Sztochasztika I. • Sztochasztika II. • Tartalomelemzés • Tömegkiszolgálás • Web- és e-szolgáltatások
2. félév (ősz)	Alkalmazott algebra • Döntéstámogatás a médiainformatikában • Ember-gép interfész • Matematikai logika • Médiarendszerek laboratórium • Nyelvek és automaták • Szoftverarchitektúrák
3. félév (tavasz)	Médiatartalom és -biztonság laboratórium
Egyéb	Kötelezően választható tárgyak • Mérnöki menedzsment • Befektetések • Érvelés, tárgyalás, meggyőzés • Információs társadalom joga • Minőségmenedzsment • Projektmenedzsment • Vállalati jog • Vezetői számvitel

Tartalomelemzés

ZH (2014. tavasz)

Ponthatárok