„ZH felkészítést segítő kvíz” változatai közötti eltérés

aNincs szerkesztési összefoglaló
deduped
1. sor: 1. sor:
{{Vissza|Beszéd-információs_rendszerek}}
{{Vissza|Beszéd-információs_rendszerek}}
{{kvízoldal|cím=ZH felkészítő|pontozás=-}}


Ez a kvíz a ZH felkészülést segíti elő, tanulást viszont nem helyettesít. A kérdések javarészt, általam kitaláltak, gyakorlatból kiszedették vagy épp KZH kérdések.  
== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
Amelyik kérdés végén (*) van, annak a válasza nem 100%, hogy helyes/ nincs rá még válasz, ezeket írjátok be ti nyugodtan, ha tudjátok rá a jó választ, illetve, ha találtok hibás megoldást, nyugodtan szerkesszétek át. Jó felkészülést kívánok!
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
 
== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# Csak a mássalhangzók maradnak meg.
# Veszteségmentesen tárolható.
# Alig érhető marad a beszéd.
# Csak az alapfrekvencia marad meg.
# Majdnem tökéletesen megmarad a beszéd.
 
== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
 
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 19 diád
# 5 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád
 
== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "p" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.


{{Kvízoldal
== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
|cím=ZH felkészítő
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "t" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.
 
== A Viterbi-algoritmus… ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A GMM paraméterek gyors közelítő számítására használható.
# A HMM paraméterek gyors közelítő számítására használható.
# Adja meg a beszédfelismerésnél a helyes eredményt.
# A HMM legjobb illeszkedésű útvonalát mindig megtalálja.
 
== A felharmonikusok definíció szerint… ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Megegyeznek a formánsok középfrekvenciáival.
# Az alapfrekvencia egész számú többszörösei.
# A rezonátorüreg által felerősített felhangnyalábok.
# Az alapfrekvencia páratlan, egészszámú többszörösei.


== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
15. sor: 77. sor:
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# t < 50 ms
# Forrás-szűrő.
# t = 50 ms
# Jel-szűrő.
# 50 < t < 100 ms
# Frekvencia-szűrő.
# 100 ms < t
# Intenzitás-szűrő.
 
== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# C-k
# V-k
# Nazálisok
# Zárhangok
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Lépésköze függ a mintavételi frekvenciától.
# Lépésköze nem függ a mintavételi frekvenciától.
# Veszteségmentesen visszaállítható.
# Lépésköze nem befolyásolja a hangminőséget.
# Csak egyenletes közökkel használják beszédre.
# Függ a beszéd alapfrekvenciájától.
 
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# Kb. 135 Hz
# Kb. 320 Hz
# Kb. 65 Hz
# Kb. 200 Hz
# Kb. 220 Hz
# Kb. 35 Hz
# Kb. 140 Hz
# Kb. 70 Hz
 
== A rejtett Markov modelleket (HMM)... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Minden esetben helyettesíthetjük Markov láncokkal.
# A Viterbi-algoritmussal taníthatjuk be.
# A GMM-ekkel együtt lehet beszédfelismerésre használni.
# Csak a GMM-mel kiegészítésben használhatjuk bármi is.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t
31. sor: 127. sor:
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t


== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Igaz
# T < 50 ms
# Hamis
# T = 50 ms
# 50 < t < 100 ms
# 100 ms < t


== Az annotálás... ==
== A “hasát” szóban milyen hang található? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag  tartalmaz.
# Pergő rész
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# Nazális
# a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Réshang
# a kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Zöngés zárhang


== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# átlapolódást (aliasing) kivédtük.
# a hangminőség a telefonosnál biztosan jobb lesz.
# többnyire érthető, de zajos lesz a jel.
# biztosan érthetetlen, használhatatlan lesz a kimenet.
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# lépésköze függ a mintavételi frekvenciától.
# lépésköze nem függ a mintavételi frekvenciától.
# veszteségmentesen visszaállítható.
# lépésköze nem befolyásolja a hangminőséget.
# csak egyenletes közökkel használják beszédre.
# függ a beszéd alapfrekvenciájától.
 
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Pergő rész
# Diád építőelemes beszédszintetizáló rendszer.
# Nazális
# Formás szintézis.
# Zöngés rész
# Beszéddetektáló rendszer.
# Zöngés zárhang


== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# á
# Diád építőelemes beszédszintetizáló rendszer.
# Záró „k”
# Formás szintézis.
# U
# Beszéddetektáló rendszer.
# A


== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Szép, természetes hangzás.
# A b felpattanás elé szünetet kell beiktatni.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# A b előtti zár szakaszt csendre kell cserélni.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# Nem megvalósítható.
 
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# Szép, természetes hangzás.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.


== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
114. sor: 174. sor:
# Fonetikai átirat és hanghatár bejelölése minden mondatra.
# Fonetikai átirat és hanghatár bejelölése minden mondatra.


== Mi hangnyomás mértékegysége? ==
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# W/m2
# Annotálás és szegmentálás.
# N/m2
# Szupraszegmentálás és koartikuláció.
# m/s2
# Koartikuláció és annotálás.
# Mértékegység nélküli.
# Egyik sem.
 
== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Sz
# K
# T
# D


== Mi az akusztikai dB mértékegysége? ==
== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# W/m2
# Spektogram.
# N/m2
# Intenzitás-idő függvény.
# m/s2
# Felvétel meghallgatása.
# Mértékegység nélküli.
# Mindegyik segít benne.
 
== Az annotálás... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Eustach-kürt
# 10 000 bsp
# Kalapács
# 480 bps
# Patkó
# 4800 bps
# Dobhártya
# 1000 bps
# 48 bps
# 48 000 bps
 
== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
# 1670 Hz
# 600 Hz
# 2980 Hz
# 500 Hz
# 550 Hz
# 100 Hz


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Eustach-kürt
# 0,5 kHz-es szinuszjel.
# Kalapács
# 2 kHz-es szinuszjel.
# Kasza
# 3 kHz-es szinuszjel.
# Üllő
# 1 kHz-es szinuszjel.
 
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 3,1 kHz-es szinuszjel.
# 1,7 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1,7 és 3,1 kHz-es szinuszjel.


== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
147. sor: 239. sor:
# 63 dB
# 63 dB
# 60 dB
# 60 dB
# 90 dB
# 90 dB
 
== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 6 dB
# -6 dB
# 3 dB
# -3 dB
 
== Hogy hívják az egyenlő hangosság érzetű görbét? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# phon
# phön
# schön
# decibel
 
== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB
 
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB
 
== Melyik szinusz jelet halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB


== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
191. sor: 248. sor:
# Papírlap susogása 1 m-ről.
# Papírlap susogása 1 m-ről.


== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Zönge
# 8 kHZ-en
# Zengő
# 4 kHz-en
# Vokál
# 3,5 kHz-en
# Spektrál
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Folytonos
# 8 kHZ-en
# Vonalas
# 4 kHz-en
# Elkent
# 3,5 kHz-en
# Felkent
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
== Egy akusztikus jellemzővektor… ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Felharmonikus
# Alapfrekvencia
# Formáns
# Oktáv
 
== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Személyfüggő kapcsolat van.
# Függetlenek tőle.
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.
 
== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A 'p' zöngétlen hang, a 'b' zöngés.
# Egy adott hosszúságú hangrészletet jellemez.
# Csak a ’p’-nek vannak zajkomponensei.
# Egy teljes bemondást jellemez.
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# Egy teljes hangot jellemez.
# Csak a zajkomponensek frekvenciahelyei térnek el.
# Egy teljes szót jellemez.


== A felharmonikusok definíció szerint… ==
== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# megegyeznek a formánsok középfrekvenciáival.
# 6 dB
# az alapfrekvencia egész számú többszörösei.
# -6 dB
# a rezonátorüreg által felerősített felhangnyalábok.
# 3 dB
# az alapfrekvencia páratlan, egészszámú többszörösei.
# -3 dB


== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# Spektogram.
# Magánhangzót látunk.
# Intenzitás-idő függvény.
# Zajt látunk.
# Felvétel meghallgatása.
# Zöngétlen hangot látunk.
# Mindegyik segít benne.
# Zárhangot látunk.
# Mássalhangzót látunk.
# Zöngés hangot látunk.


== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# PAMPA
# Fojtott zöngét látunk.
# SAMPA
# Egy réshang részletét látjuk.
# PUMPA
# Túl kvantálási szint van.
# SAMBA
# A zaj kimaszkolta a jelet.
# MP3 kódolás hibája.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.


== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
# sz
# MP3 kódolás.
# k
# Egy réshang részletét látjuk.
# t
# Fojtott zöngét látunk.
# d
# A zaj kimaszkolta a jelet.
 
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Annotálás és szegmentálás.
# Szupraszegmentálás és koartikuláció.
# Koartikuláció és annotálás.
# Egyik sem.


== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
268. sor: 314. sor:
# Egyik sem.
# Egyik sem.


== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
# Forrás-szűrő.
# -1
# Jel-szűrő.
# -2
# Frekvencia-szűrő.
# -6
# Intenzitás-szűrő.
# -3
# -4
# -5


== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Pergő rész
# 88 Byte
# Nazális
# 44 kByte
# Zöngés rész
# 176 kByte
# Zöngés zárhang
# 88 kByte


== A “hasát” szóban milyen hang található? ==
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Pergő rész
# 88 Byte
# Nazális
# 44 kByte
# Réshang
# 88 kByte
# Zöngés zárhang
# 132 kByte


== Mi igaz az F0, F1, F2 értékekre? ==
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# F1 és F2 gyakorlatilag független F0-tól.
# 6 * 6 + 18 * 18
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# 24 * 24 + 18 * 5 * 5
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# 24 * 24 * 24
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18


== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# 7 * 19 * 26
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# 19 * 19 * 19 + 7 * 7 * 7
# A zöngés hang zöngétlenedik.
# 26 * 26
# A zöngés hang felhangosodik.
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26


== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Az energiája megnő.
# 26 * 26 * 26 + 10 * 10 * 10
# Megismétlődik a felpattanó rész.
# 36 * 36 + 26 * 10 * 10
# Zárrész megnyúlik.
# 36 * 36 + 10 * 26 * 26
# Megnő az alapfrekvenciája.
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
 
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.


== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# Más lesz a felharmonikusok menete a mondat közepén.
# 200 Hz
# Más az alapfrekvencia menete.
# 25 Hz
# Változatlan marad.
# 400 Hz
# Formánsok megváltoznak.
# 100 Hz
# 125 Hz
# 250 Hz


== Melyik hangnak a legmagasabb az F2 értéke? ==
== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=|pontozás=-}}
# i
# 1000
# a
# 5
# u
# 13
# e
# 200
# 16 000
# 80


== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# á
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Záró „k”
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# u
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# a
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.


== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
338. sor: 407. sor:
# 70 Hz
# 70 Hz


== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
== Hogy hívják az egyenlő hangosság érzetű görbét? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A b felpattanás elé szünetet kell beiktatni.
# Phon
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Phön
# A b előtti zár szakaszt csendre kell cserélni.
# Schön
# Nem megvalósítható.
# Decibel


== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 0,5 kHz-es szinuszjel.
# 2 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1 kHz-es szinuszjel.
 
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 3,1 kHz-es szinuszjel.
# 1,7 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1,7 és 3,1 kHz-es szinuszjel.
 
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Személyfüggő kapcsolat van.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Függetlenek tőle.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.


== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
 
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 16 kHz
# Zönge
# 8 kHz
# Zengő
# 1 kHz
# Vokál
# 2 kHz
# Spektrál


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Felharmonikus
# 44 kByte
# Alapfrekvencia
# 176 kByte
# Formáns
# 88 kByte
# Oktáv


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Az energiája megnő.
# 44 kByte
# Megismétlődik a felpattanó rész.
# 88 kByte
# Zárrész megnyúlik.
# 132 kByte
# Megnő az alapfrekvenciája.


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
401. sor: 449. sor:
# 16 bites
# 16 bites


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
# 4 bites
# 4 bites
# 16 bites
# 16 bites
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# Erős háttérzaj a beszéd felvétele közben.
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# A bemeneti aluláteresztő szűrő hiánya.
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 32
# 20
# 3
# 7


== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# 1600
# 1600
# 10 000
# 10 000
# 256
# 256
# 64
# 64
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 39 * 39 * 39
# 39 * 39 * 39
# 25 + 14
# 25 + 14
# 39 * 39
# 39 * 39
# 25 * 25 * 14 + 25 * 25
# 25 * 25 * 14 + 25 * 25
== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM statisztikai TTS.
# WaveNet TTS.
# Kempelen gépe.
# Diád alapú hullámforma.


== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
457. sor: 474. sor:
# 250
# 250


== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? pl: +36-30-123-4567? ==
== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 1000
# 1000
464. sor: 481. sor:
# 250
# 250


== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM alapú statisztikai parametrikus TTS.
# Igaz
# Diád alapú hullámforma összefűzéses TTS.
# Hamis
# LPC alapú TTS.
# Kempelen beszélő gépe.


== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# Jel-idő függvény alapon.
# Egó
# LPC alapú TTS-en.
# Lás
# Időtengely alapon.
# Sen
# Frekvencia-jel függvény alapon.
# átp
# Csók
# Rak


== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
== LPC analízisnél előállított maradékjelre mi jellemző? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 – 20 000 Hz
# Kinyerhetők belőle a formánsfrekvencia értékek.
# 30 – 3400 Hz
# Több biten kvantálható, mint az eredeti jel.
# 6000 – 10 000 Hz
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# 300 – 4000 Hz
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# 1000 – 7000 Hz
# Eldobható az eredeti jel enélkül is visszaállítható.
# Nagyobb az energiája az eredeti jelnél.


== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
493. sor: 511. sor:
# 2
# 2


== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
# 180
# Hangszalagok
# 200
# Szájüreg
# 256
# Orrüreg
# 25
# Garat
# Tüdő
# Nyelv
 
== Mely hang(ok) zöngétlen(ek)? ==
{{kvízkérdés|típus=több|válasz=2,9|pontozás=-}}
# D
# Cs
# L
# Dz
# V
# G
# Zs
# Z
# K


== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# F0, F1, F2, F3
# Csak 6 bit alatti kvantálásnál létezik.
# B1, B2, B3, F0, F1, F2, F3
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# zönge, zörej, F0, F1, F2, F3, hangerő
# Függ a mintavételi frekvenciától.
# zönge, zörej, F1, F2, F3, F4, hangerő
# Csak logaritmikus kvantálásnál jelentkezik.
# Függ a kvantálási lépcsők számától.
# Lineáris kvantálásnál is létezik.


== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# F0, F1, F2, F3
# HMM statisztikai TTS.
# B1, B2, B3, B4, B5
# WaveNet TTS.
# zönge, zörej, F0, F1, F2, F3, hangerő
# Kempelen gépe.
# zönge, zörej, F1, F2, F3, F4, hangerő
# Diád alapú hullámforma.


== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
== Melyik hang(ok)nak van periodikus szakasza? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,2,7,8|pontozás=-}}
# Hogy a magánhangzók érthetőbbek legyenek.
# L
# Hogy ne legyen „huppogós” a beszéd.
# M
# Hogy a zárhangok érthetőbbek legyenek.
# Sz
# Hogy a réshangok érthetőbbek legyenek.
# F
# S
# H
# J
# Ny


== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
== Melyik hangnak a legmagasabb az F2 értéke? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# C-k
# I
# V-k
# A
# Nazálisok
# U
# Zárhangok
# E


== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
534. sor: 572. sor:
# Az első 256 komponensét.
# Az első 256 komponensét.
# Az első 512 komponensét.
# Az első 512 komponensét.
== Egy akusztikus jellemzővektor… ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# egy adott hosszúságú hangrészletet jellemez.
# egy teljes bemondást jellemez.
# egy teljes hangot jellemez.
# egy teljes szót jellemez.
== Mire jó a Gaussian Mixture Model (GMM)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Mindenre, amire a HMM is.
# Csak a HMM-mel kiegészítésben használható.
# Időillesztésre.
# Hasonlósági mérték számítására.
== A rejtett Markov modelleket (HMM)... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# minden esetben helyettesíthetjük Markov láncokkal.
# a Viterbi-algoritmussal taníthatjuk be.
# a GMM-ekkel együtt lehet beszédfelismerésre használni.
# csak a GMM-mel kiegészítésben használhatjuk bármi is.
== A Viterbi-algoritmus… ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# a GMM paraméterek gyors közelítő számítására használható.
# a HMM paraméterek gyors közelítő számítására használható.
# adja meg a beszédfelismerésnél a helyes eredményt.
# a HMM legjobb illeszkedésű útvonalát mindig megtalálja.
== Melyik állítás(ok) igaz(ak)? ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# Beszédre csak lineáris kvantálást használunk.
# LPC-10 kódoló csak a zöngés részt kódolja.
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# A-törvényű (A-law) kvantálás lineáris.
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# Logaritmikus kvantálás veszteségmentesen visszaállítható.
== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
# Hangszalagok
# Szájüreg
# Orrüreg
# Garat
# Tüdő
# Nyelv
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 19 diád
# 5 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád


== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
599. sor: 582. sor:
# 18 kHz / 99 dB
# 18 kHz / 99 dB


== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszéddetektáló rendszer.
 
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 375 ms
# Korpusz alapú elem összefűzős rendszer.
# 280 ms
# Diád építőelemes beszédszintetizáló rendszer.
# 350 ms
# Formás szintézis.
# 325 ms
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
# 200 ms
 
# 240 ms
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszéddetektáló rendszer.


== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
== Melyik nem játszik közvetlen szerepet a hallásban? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Magánhangzót látunk.
# Eustach-kürt
# Zajt látunk.
# Kalapács
# Zöngétlen hangot látunk.
# Patkó
# Zárhangot látunk.
# Dobhártya
# Mássalhangzót látunk.
# Kasza
# Zöngés hangot látunk.
# Üllő


== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
== Melyik szinusz jelet halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 1670 Hz
# 40 Hz-es 45 dB
# 600 Hz
# 1 kHz-es 50 dB
# 2980 Hz
# 2 kHz-es 49 dB
# 500 Hz
# 10 kHz-es 51 dB
# 550 Hz
# 100 Hz


== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# -1
# 40 Hz-es 45 dB
# -2
# 1 kHz-es 50 dB
# -6
# 2 kHz-es 49 dB
# -3
# 10 kHz-es 51 dB
# -4
# -5


== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# egó
# 40 Hz-es 45 dB
# lás
# 1 kHz-es 50 dB
# sen
# 2 kHz-es 49 dB
# átp
# 10 kHz-es 51 dB
# csók
# rak


== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! hangsorban, ha azt egy nő ejti ki? ==
== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 200 ms
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# 1 ms
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# 100 μs
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# 4 ms
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# 40 ms
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.
# 400 μs


== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
# Módosíthatja a hangidőtartamot.
# MFCC paramétereket számolunk vele.
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# Megszünteti a frekvenciaelfedés jelenséget.
# Módosítható vele a mintavételi frekvencia.
# Beszédfelismerésben használt.


== LPC analízisnél előállított maradékjelre mi jellemző? ==
== Melyik állítás(ok) igaz(ak)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# Kinyerhetők belőle a formánsfrekvencia értékek.
# Beszédre csak lineáris kvantálást használunk.
# Több biten kvantálható, mint az eredeti jel.
# LPC-10 kódoló csak a zöngés részt kódolja.
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# A-törvényű (A-law) kvantálás lineáris.
# Eldobható az eredeti jel enélkül is visszaállítható.
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# Nagyobb az energiája az eredeti jelnél.
# Logaritmikus kvantálás veszteségmentesen visszaállítható.


== Mely hang(ok) zöngétlen(ek)? ==
== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# d
# PAMPA
# cs
# SAMPA
# l
# PUMPA
# dz
# SAMBA
# v
# g


== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# 20 – 20 000 Hz
# Normál beszéd 1m-ről.
# 30 – 3400 Hz
# Sugárhajtású repülő hajtóműve 15m-ről.
# 6000 – 10 000 Hz
# Suttogó beszéd 10m-ről.
# 300 – 4000 Hz
# Elhaladó vonat 2m-ről.
# 1000 – 7000 Hz
# Erős közúti forgalom 1m-ről.


== Mi a Tacotron 2? ==
== Mi a Tacotron 2? ==
698. sor: 698. sor:
# Egy HMM alapú hullámforma generáló rendszer.
# Egy HMM alapú hullámforma generáló rendszer.
# End-to-end rendszer.
# End-to-end rendszer.
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# kb. 135 Hz
# kb. 320 Hz
# kb. 65 Hz
# kb. 200 Hz
# kb. 220 Hz
# kb. 35 Hz
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# 1800 μs
# 45 s
# 30 s
# 900 ms
# 2000 ms
# 5800 μs
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# 6 * 6 + 18 * 18
# 24 * 24 + 18 * 5 * 5
# 24 * 24 * 24
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 26 * 26 * 26 + 10 * 10 * 10
# 36 * 36 + 26 * 10 * 10
# 36 * 36 + 10 * 26 * 26
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 7 * 19 * 26
# 19 * 19 * 19 + 7 * 7 * 7
# 26 * 26
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 78 dBA
# 800 dBA
# 18 dBA
# 138 dBA
# 8 dBA
# -18 dBA


== Mi a WaveNet? ==
== Mi a WaveNet? ==
808. sor: 709. sor:
# Egy mély neurális háló alapú hullámforma generáló rendszer.
# Egy mély neurális háló alapú hullámforma generáló rendszer.


== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
== Mi az akusztikai dB mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 Hz - 30 Hz
# W/m2
# 20 kHz - 30 kHz
# N/m2
# 10 Hz - 20 Hz
# M/s2
# 15 kHz - 20 kHz
# Mértékegység nélküli.
# 50 Hz - 5 kHz
 
# 5 kHz - 10 kHz
== Mi hangnyomás mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# W/m2
# N/m2
# M/s2
# Mértékegység nélküli.


== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,6|pontozás=-}}
# 20 Hz - 30 Hz
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# 20 kHz - 30 kHz
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# 10 Hz - 20 Hz
# Lineáris predikciós kódolás.
# 3 kHz - 10 kHz
# Erős háttérzaj a beszéd felvétele közben.
# 50 Hz - 5 kHz
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# 5 kHz - 10 kHz
# A bemeneti aluláteresztő szűrő hiánya.


== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
== Mi igaz az F0, F1, F2 értékekre? ==
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# F1 és F2 gyakorlatilag független F0-tól.
# Nagy energiájú hang lesz.
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# Felpattanás a hang elejére kerül.  
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# Több mint 100 ms hosszú a "p" hang.
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.


== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
== Mi jellemző a "p" hangra? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Zöngés.
# Nagy energiájú hang lesz.
# Zárhang.
# Felpattanás a hang elejére kerül.  
# Felpattanás a hang elején található.
# Több mint 100 ms hosszú a "t" hang.
# F2 értéke magas.
# A némafázisa nem hosszabb mint 100 μs.
# Nazális.
# Fojtott zönge legalább 100 ms lesz.
# Fojtott zöngét tartalmaz.


== Mi jellemző a formánsokra? ==
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,4,8,10|pontozás=-}}
# A néma fázisoknál is megmérhető.
# A néma fázisoknál is megmérhető.
# Értékük független a beszélő nemétől.
# Értékük független a beszélő nemétől.
852. sor: 756. sor:
# A magánhangzóknak 1440 db formánsa van.
# A magánhangzóknak 1440 db formánsa van.
# Vonalas spektrum esetén nem meghatározható.
# Vonalas spektrum esetén nem meghatározható.
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Nem csak az F0 egész számú többszöröse lehet.
# Nem csak az F0 egész számú többszöröse lehet.
860. sor: 761. sor:
# A hang spektrumából meghatározható.
# A hang spektrumából meghatározható.
# Nem függ a beszédhangtól.
# Nem függ a beszédhangtól.
# Vonalas spektrum esetén nem meghatározható.


== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
== Mi jellemző a μ-law kódolásra? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 200 Hz
# A HMM beszédfelismerés előfeldolgozója.
# 25 Hz
# μ meredekségű lineáris kvantálás.
# 400 Hz
# Négyzetes kvantálású.
# 100 Hz
# 8 bites lineáris kvantálás.
# 125 Hz
# Nagy amplitúdó esetén ritkább a kvantálás.
# 250 Hz
# MFCC paraméterei.


== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# kb. 140 Hz
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# kb. 200 Hz
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# kb. 70 Hz
# A zöngés hang zöngétlenedik.
# kb. 220 Hz
# A zöngés hang felhangosodik.
# kb. 320 Hz
# kb. 35 Hz


== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5900 μs
# Más lesz a felharmonikusok menete a mondat közepén.
# 900 ms
# Más az alapfrekvencia menete.
# 2500 μs
# Változatlan marad.
# 30 s
# Formánsok megváltoznak.
# 45 s
# 5800 ms


== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Módosíthatja a hangidőtartamot.
# A 'p' zöngétlen hang, a 'b' zöngés.
# MFCC paramétereket számolunk vele.
# Csak a ’p’-nek vannak zajkomponensei.
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# Megszünteti a frekvenciaelfedés jelenséget.
# Csak a zajkomponensek frekvenciahelyei térnek el.
# Módosítható vele a mintavételi frekvencia.
# Beszédfelismerésben használt.


== Mely hang(ok) zöngétlen(ek)? ==
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# g
# Szép, természetes hangzás.
# zs
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# d
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# dz
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# z
# k


== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Szép, természetes hangzás.
# Normál beszéd 1m-ről.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Suttogó beszéd 10m-ről.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.


== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 10 000 bsp
# Jel-idő függvény alapon.
# 480 bps
# LPC alapú TTS-en.
# 4800 bps
# Időtengely alapon.
# 1000 bps
# Frekvencia-jel függvény alapon.
# 48 bps
 
# 48 000 bps
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.


== Mi jellemző a μ-law kódolásra? ==
== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# A HMM beszédfelismerés előfeldolgozója.
# HMM alapú statisztikai parametrikus TTS.
# μ meredekségű lineáris kvantálás.
# Diád alapú hullámforma összefűzéses TTS.
# Négyzetes kvantálású.
# LPC alapú TTS.
# 8 bites lineáris kvantálás.
# Kempelen beszélő gépe.
# Nagy amplitúdó esetén ritkább a kvantálás.
# MFCC paraméterei.


== Mi jellemző a "p" hangra? ==
== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Zöngés.
# 20 Hz - 30 Hz
# Zárhang.
# 20 kHz - 30 kHz
# Felpattanás a hang elején található.
# 10 Hz - 20 Hz
# F2 értéke magas.
# 3 kHz - 10 kHz
# Nazális.
# 50 Hz - 5 kHz
# Fojtott zöngét tartalmaz.
# 5 kHz - 10 kHz


== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# 20 Hz - 30 Hz
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# 20 kHz - 30 kHz
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# 10 Hz - 20 Hz
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# 15 kHz - 20 kHz
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. az "alma" és a "körte" bemondások hasonlósága számítható.
# 50 Hz - 5 kHz
# 5 kHz - 10 kHz


== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# 5900 μs
# Csak a mássalhangzók maradnak meg.
# 900 ms
# Veszteségmentesen tárolható.
# 2500 μs
# Alig érhető marad a beszéd.
# 30 s
# Csak az alapfrekvencia marad meg.
# 45 s
# Majdnem tökéletesen megmarad a beszéd.
# 5800 ms
 
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# 1800 μs
# 45 s
# 30 s
# 900 ms
# 2000 ms
# 5800 μs


== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
969. sor: 872. sor:
# 10 hang
# 10 hang


== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
# Csak 6 bit alatti kvantálásnál létezik.
# 200 ms
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# 1 ms
# Függ a mintavételi frekvenciától.
# 100 μs
# Csak logaritmikus kvantálásnál jelentkezik.
# 4 ms
# Függ a kvantálási lépcsők számától.
# 40 ms
# Lineáris kvantálásnál is létezik.
# 400 μs
 
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 78 dBA
# 800 dBA
# 18 dBA
# 138 dBA
# 8 dBA
# -18 dBA
 
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 16 kHz
# 8 kHz
# 1 kHz
# 2 kHz
 
== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# F0, F1, F2, F3
# B1, B2, B3, F0, F1, F2, F3
# Zönge, zörej, F0, F1, F2, F3, hangerő
# Zönge, zörej, F1, F2, F3, F4, hangerő


== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) ==
== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
{{kvízkérdés|típus=egy|válasz=|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 1000
# F0, F1, F2, F3
# 5
# B1, B2, B3, B4, B5
# 13
# Zönge, zörej, F0, F1, F2, F3, hangerő
# 200
# Zönge, zörej, F1, F2, F3, F4, hangerő
# 16 000
# 80


== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)==
== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# MP3 kódolás.
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# Egy réshang részletét látjuk.
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Fojtott zöngét látunk.
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# A zaj kimaszkolta a jelet.
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.


== Melyik hang(ok)nak van periodikus szakasza? ==
== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
{{kvízkérdés|típus=több|válasz=1,2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# l
# Folytonos
# m
# Vonalas
# sz
# Elkent
# f
# Felkent
# s
# h


== Melyik hang(ok)nak van periodikus szakasza? ==
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# f
# 32
# j
# 20
# h
# 3
# ny
# 7
# s
# sz


== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== Mire jó a Gaussian Mixture Model (GMM)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# Mindenre, amire a HMM is.
# 4 kHz-en
# Csak a HMM-mel kiegészítésben használható.
# 3,5 kHz-en
# Időillesztésre.
# 7 kHz-en
# Hasonlósági mérték számítására.
# 1 kHz-en
 
# Sehol, mert kiszűrésre kerül.
== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Hogy a magánhangzók érthetőbbek legyenek.
# Hogy ne legyen „huppogós” a beszéd.
# Hogy a zárhangok érthetőbbek legyenek.
# Hogy a réshangok érthetőbbek legyenek.
 
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
 
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
 
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4


== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# 375 ms
# 4 kHz-en
# 280 ms
# 3,5 kHz-en
# 350 ms
# 7 kHz-en
# 325 ms
# 1 kHz-en
# 200 ms
# Sehol, mert kiszűrésre kerül.
# 240 ms
 
== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 180
# 200
# 256
# 25


== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)==
== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Fojtott zöngét látunk.
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# Egy réshang részletét látjuk.
# átlapolódást (aliasing) kivédtük.
# Túl kvantálási szint van.
# A hangminőség a telefonosnál biztosan jobb lesz.
# A zaj kimaszkolta a jelet.
# Többnyire érthető, de zajos lesz a jel.
# MP3 kódolás hibája.
# Biztosan érthetetlen, használhatatlan lesz a kimenet.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.