„Tartalomelemzés” változatai közötti eltérés
aNincs szerkesztési összefoglaló |
Nincs szerkesztési összefoglaló |
||
| 16. sor: | 16. sor: | ||
| tárgyhonlap = | | tárgyhonlap = | ||
}} | }} | ||
= ZH (2014. tavasz) = | |||
# Naiv Bayes osztályozó | |||
## Milyen képleten alapul; hogyan lehet a tényezőit becsülni? | |||
## Hogy alkalmazható többcímkés osztályozásra? | |||
## Milyen a tanulás és tesztelés időigénye, és miért? | |||
# Hogy segíthet a tokenizálásnál, ha ismert a dokumentum nyelve? | |||
# Mi a szó-dokumentum mátrix használatának hátránya? | |||
# Milyen hibát véthet egy szótövező? | |||
# Egy korpuszban a második leggyakrabban előforduló szó relatív gyakorisága ''r''. Mennyi a 4. leggyakoribb szó relatív gyakorisága, ha a korpuszban előforduló szavak eloszlására igaz a Zipf-törvény (alfa = 1 esetén)? | |||
# Melyek a szótövező eljárások 3 nagy típusa? Mutassa be őket egy-két mondatban. | |||
# Egy osztályozó mért pontossága (presision) ⅔. Milyen határok között lehet az F1 mértéke? | |||
# Mi az a CRF és mire használható? | |||
{{Lábléc - Médiainformatika szakirány}} | {{Lábléc - Médiainformatika szakirány}} | ||