„ZH felkészítést segítő kvíz” változatai közötti eltérés

A VIK Wikiből
aNincs szerkesztési összefoglaló
deduped
1. sor: 1. sor:
{{Vissza|Beszéd-információs_rendszerek}}
{{Vissza|Beszéd-információs_rendszerek}}
{{kvízoldal|cím=ZH felkészítő|pontozás=-}}


Ez a kvíz a ZH felkészülést segíti elő, tanulást viszont nem helyettesít. A kérdések javarészt, általam kitaláltak, gyakorlatból kiszedették vagy épp KZH kérdések.  
== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
Amelyik kérdés végén (*) van, annak a válasza nem 100%, hogy helyes/ nincs rá még válasz, ezeket írjátok be ti nyugodtan, ha tudjátok rá a jó választ, illetve, ha találtok hibás megoldást, nyugodtan szerkesszétek át. Jó felkészülést kívánok!
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
 
== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# Csak a mássalhangzók maradnak meg.
# Veszteségmentesen tárolható.
# Alig érhető marad a beszéd.
# Csak az alapfrekvencia marad meg.
# Majdnem tökéletesen megmarad a beszéd.
 
== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
 
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 19 diád
# 5 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád
 
== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "p" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.


{{Kvízoldal
== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
|cím=ZH felkészítő
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "t" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.
 
== A Viterbi-algoritmus… ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A GMM paraméterek gyors közelítő számítására használható.
# A HMM paraméterek gyors közelítő számítására használható.
# Adja meg a beszédfelismerésnél a helyes eredményt.
# A HMM legjobb illeszkedésű útvonalát mindig megtalálja.
 
== A felharmonikusok definíció szerint… ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Megegyeznek a formánsok középfrekvenciáival.
# Az alapfrekvencia egész számú többszörösei.
# A rezonátorüreg által felerősített felhangnyalábok.
# Az alapfrekvencia páratlan, egészszámú többszörösei.


== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
15. sor: 77. sor:
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# t < 50 ms
# Forrás-szűrő.
# t = 50 ms
# Jel-szűrő.
# 50 < t < 100 ms
# Frekvencia-szűrő.
# 100 ms < t
# Intenzitás-szűrő.
 
== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# C-k
# V-k
# Nazálisok
# Zárhangok
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Lépésköze függ a mintavételi frekvenciától.
# Lépésköze nem függ a mintavételi frekvenciától.
# Veszteségmentesen visszaállítható.
# Lépésköze nem befolyásolja a hangminőséget.
# Csak egyenletes közökkel használják beszédre.
# Függ a beszéd alapfrekvenciájától.
 
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# Kb. 135 Hz
# Kb. 320 Hz
# Kb. 65 Hz
# Kb. 200 Hz
# Kb. 220 Hz
# Kb. 35 Hz
# Kb. 140 Hz
# Kb. 70 Hz
 
== A rejtett Markov modelleket (HMM)... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Minden esetben helyettesíthetjük Markov láncokkal.
# A Viterbi-algoritmussal taníthatjuk be.
# A GMM-ekkel együtt lehet beszédfelismerésre használni.
# Csak a GMM-mel kiegészítésben használhatjuk bármi is.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t
31. sor: 127. sor:
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t


== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Igaz
# T < 50 ms
# Hamis
# T = 50 ms
# 50 < t < 100 ms
# 100 ms < t


== Az annotálás... ==
== A “hasát” szóban milyen hang található? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag  tartalmaz.
# Pergő rész
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# Nazális
# a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Réshang
# a kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Zöngés zárhang


== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# átlapolódást (aliasing) kivédtük.
# a hangminőség a telefonosnál biztosan jobb lesz.
# többnyire érthető, de zajos lesz a jel.
# biztosan érthetetlen, használhatatlan lesz a kimenet.
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# lépésköze függ a mintavételi frekvenciától.
# lépésköze nem függ a mintavételi frekvenciától.
# veszteségmentesen visszaállítható.
# lépésköze nem befolyásolja a hangminőséget.
# csak egyenletes közökkel használják beszédre.
# függ a beszéd alapfrekvenciájától.
 
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Pergő rész
# Diád építőelemes beszédszintetizáló rendszer.
# Nazális
# Formás szintézis.
# Zöngés rész
# Beszéddetektáló rendszer.
# Zöngés zárhang


== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# á
# Diád építőelemes beszédszintetizáló rendszer.
# Záró „k”
# Formás szintézis.
# U
# Beszéddetektáló rendszer.
# A


== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Szép, természetes hangzás.
# A b felpattanás elé szünetet kell beiktatni.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# A b előtti zár szakaszt csendre kell cserélni.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# Nem megvalósítható.
 
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# Szép, természetes hangzás.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.


== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
114. sor: 174. sor:
# Fonetikai átirat és hanghatár bejelölése minden mondatra.
# Fonetikai átirat és hanghatár bejelölése minden mondatra.


== Mi hangnyomás mértékegysége? ==
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# W/m2
# Annotálás és szegmentálás.
# N/m2
# Szupraszegmentálás és koartikuláció.
# m/s2
# Koartikuláció és annotálás.
# Mértékegység nélküli.
# Egyik sem.
 
== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Sz
# K
# T
# D


== Mi az akusztikai dB mértékegysége? ==
== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# W/m2
# Spektogram.
# N/m2
# Intenzitás-idő függvény.
# m/s2
# Felvétel meghallgatása.
# Mértékegység nélküli.
# Mindegyik segít benne.
 
== Az annotálás... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Eustach-kürt
# 10 000 bsp
# Kalapács
# 480 bps
# Patkó
# 4800 bps
# Dobhártya
# 1000 bps
# 48 bps
# 48 000 bps
 
== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
# 1670 Hz
# 600 Hz
# 2980 Hz
# 500 Hz
# 550 Hz
# 100 Hz


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Eustach-kürt
# 0,5 kHz-es szinuszjel.
# Kalapács
# 2 kHz-es szinuszjel.
# Kasza
# 3 kHz-es szinuszjel.
# Üllő
# 1 kHz-es szinuszjel.
 
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 3,1 kHz-es szinuszjel.
# 1,7 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1,7 és 3,1 kHz-es szinuszjel.


== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
147. sor: 239. sor:
# 63 dB
# 63 dB
# 60 dB
# 60 dB
# 90 dB
# 90 dB
 
== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 6 dB
# -6 dB
# 3 dB
# -3 dB
 
== Hogy hívják az egyenlő hangosság érzetű görbét? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# phon
# phön
# schön
# decibel
 
== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB
 
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB
 
== Melyik szinusz jelet halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB


== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
191. sor: 248. sor:
# Papírlap susogása 1 m-ről.
# Papírlap susogása 1 m-ről.


== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Zönge
# 8 kHZ-en
# Zengő
# 4 kHz-en
# Vokál
# 3,5 kHz-en
# Spektrál
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Folytonos
# 8 kHZ-en
# Vonalas
# 4 kHz-en
# Elkent
# 3,5 kHz-en
# Felkent
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
== Egy akusztikus jellemzővektor… ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Felharmonikus
# Alapfrekvencia
# Formáns
# Oktáv
 
== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Személyfüggő kapcsolat van.
# Függetlenek tőle.
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.
 
== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A 'p' zöngétlen hang, a 'b' zöngés.
# Egy adott hosszúságú hangrészletet jellemez.
# Csak a ’p’-nek vannak zajkomponensei.
# Egy teljes bemondást jellemez.
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# Egy teljes hangot jellemez.
# Csak a zajkomponensek frekvenciahelyei térnek el.
# Egy teljes szót jellemez.


== A felharmonikusok definíció szerint… ==
== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# megegyeznek a formánsok középfrekvenciáival.
# 6 dB
# az alapfrekvencia egész számú többszörösei.
# -6 dB
# a rezonátorüreg által felerősített felhangnyalábok.
# 3 dB
# az alapfrekvencia páratlan, egészszámú többszörösei.
# -3 dB


== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# Spektogram.
# Magánhangzót látunk.
# Intenzitás-idő függvény.
# Zajt látunk.
# Felvétel meghallgatása.
# Zöngétlen hangot látunk.
# Mindegyik segít benne.
# Zárhangot látunk.
# Mássalhangzót látunk.
# Zöngés hangot látunk.


== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# PAMPA
# Fojtott zöngét látunk.
# SAMPA
# Egy réshang részletét látjuk.
# PUMPA
# Túl kvantálási szint van.
# SAMBA
# A zaj kimaszkolta a jelet.
# MP3 kódolás hibája.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.


== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
# sz
# MP3 kódolás.
# k
# Egy réshang részletét látjuk.
# t
# Fojtott zöngét látunk.
# d
# A zaj kimaszkolta a jelet.
 
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Annotálás és szegmentálás.
# Szupraszegmentálás és koartikuláció.
# Koartikuláció és annotálás.
# Egyik sem.


== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
268. sor: 314. sor:
# Egyik sem.
# Egyik sem.


== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
# Forrás-szűrő.
# -1
# Jel-szűrő.
# -2
# Frekvencia-szűrő.
# -6
# Intenzitás-szűrő.
# -3
# -4
# -5


== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Pergő rész
# 88 Byte
# Nazális
# 44 kByte
# Zöngés rész
# 176 kByte
# Zöngés zárhang
# 88 kByte


== A “hasát” szóban milyen hang található? ==
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Pergő rész
# 88 Byte
# Nazális
# 44 kByte
# Réshang
# 88 kByte
# Zöngés zárhang
# 132 kByte


== Mi igaz az F0, F1, F2 értékekre? ==
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# F1 és F2 gyakorlatilag független F0-tól.
# 6 * 6 + 18 * 18
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# 24 * 24 + 18 * 5 * 5
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# 24 * 24 * 24
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18


== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# 7 * 19 * 26
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# 19 * 19 * 19 + 7 * 7 * 7
# A zöngés hang zöngétlenedik.
# 26 * 26
# A zöngés hang felhangosodik.
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26


== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Az energiája megnő.
# 26 * 26 * 26 + 10 * 10 * 10
# Megismétlődik a felpattanó rész.
# 36 * 36 + 26 * 10 * 10
# Zárrész megnyúlik.
# 36 * 36 + 10 * 26 * 26
# Megnő az alapfrekvenciája.
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
 
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.


== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# Más lesz a felharmonikusok menete a mondat közepén.
# 200 Hz
# Más az alapfrekvencia menete.
# 25 Hz
# Változatlan marad.
# 400 Hz
# Formánsok megváltoznak.
# 100 Hz
# 125 Hz
# 250 Hz


== Melyik hangnak a legmagasabb az F2 értéke? ==
== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=|pontozás=-}}
# i
# 1000
# a
# 5
# u
# 13
# e
# 200
# 16 000
# 80


== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# á
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Záró „k”
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# u
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# a
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.


== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
338. sor: 407. sor:
# 70 Hz
# 70 Hz


== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
== Hogy hívják az egyenlő hangosság érzetű görbét? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A b felpattanás elé szünetet kell beiktatni.
# Phon
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Phön
# A b előtti zár szakaszt csendre kell cserélni.
# Schön
# Nem megvalósítható.
# Decibel


== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 0,5 kHz-es szinuszjel.
# 2 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1 kHz-es szinuszjel.
 
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 3,1 kHz-es szinuszjel.
# 1,7 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1,7 és 3,1 kHz-es szinuszjel.
 
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Személyfüggő kapcsolat van.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Függetlenek tőle.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.


== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
 
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 16 kHz
# Zönge
# 8 kHz
# Zengő
# 1 kHz
# Vokál
# 2 kHz
# Spektrál


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Felharmonikus
# 44 kByte
# Alapfrekvencia
# 176 kByte
# Formáns
# 88 kByte
# Oktáv


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Az energiája megnő.
# 44 kByte
# Megismétlődik a felpattanó rész.
# 88 kByte
# Zárrész megnyúlik.
# 132 kByte
# Megnő az alapfrekvenciája.


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
401. sor: 449. sor:
# 16 bites
# 16 bites


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
# 4 bites
# 4 bites
# 16 bites
# 16 bites
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# Erős háttérzaj a beszéd felvétele közben.
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# A bemeneti aluláteresztő szűrő hiánya.
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 32
# 20
# 3
# 7


== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# 1600
# 1600
# 10 000
# 10 000
# 256
# 256
# 64
# 64
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 39 * 39 * 39
# 39 * 39 * 39
# 25 + 14
# 25 + 14
# 39 * 39
# 39 * 39
# 25 * 25 * 14 + 25 * 25
# 25 * 25 * 14 + 25 * 25
== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM statisztikai TTS.
# WaveNet TTS.
# Kempelen gépe.
# Diád alapú hullámforma.


== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
457. sor: 474. sor:
# 250
# 250


== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? pl: +36-30-123-4567? ==
== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 1000
# 1000
464. sor: 481. sor:
# 250
# 250


== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM alapú statisztikai parametrikus TTS.
# Igaz
# Diád alapú hullámforma összefűzéses TTS.
# Hamis
# LPC alapú TTS.
# Kempelen beszélő gépe.


== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# Jel-idő függvény alapon.
# Egó
# LPC alapú TTS-en.
# Lás
# Időtengely alapon.
# Sen
# Frekvencia-jel függvény alapon.
# átp
# Csók
# Rak


== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
== LPC analízisnél előállított maradékjelre mi jellemző? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 – 20 000 Hz
# Kinyerhetők belőle a formánsfrekvencia értékek.
# 30 – 3400 Hz
# Több biten kvantálható, mint az eredeti jel.
# 6000 – 10 000 Hz
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# 300 – 4000 Hz
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# 1000 – 7000 Hz
# Eldobható az eredeti jel enélkül is visszaállítható.
# Nagyobb az energiája az eredeti jelnél.


== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
493. sor: 511. sor:
# 2
# 2


== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
# 180
# Hangszalagok
# 200
# Szájüreg
# 256
# Orrüreg
# 25
# Garat
# Tüdő
# Nyelv
 
== Mely hang(ok) zöngétlen(ek)? ==
{{kvízkérdés|típus=több|válasz=2,9|pontozás=-}}
# D
# Cs
# L
# Dz
# V
# G
# Zs
# Z
# K


== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# F0, F1, F2, F3
# Csak 6 bit alatti kvantálásnál létezik.
# B1, B2, B3, F0, F1, F2, F3
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# zönge, zörej, F0, F1, F2, F3, hangerő
# Függ a mintavételi frekvenciától.
# zönge, zörej, F1, F2, F3, F4, hangerő
# Csak logaritmikus kvantálásnál jelentkezik.
# Függ a kvantálási lépcsők számától.
# Lineáris kvantálásnál is létezik.


== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# F0, F1, F2, F3
# HMM statisztikai TTS.
# B1, B2, B3, B4, B5
# WaveNet TTS.
# zönge, zörej, F0, F1, F2, F3, hangerő
# Kempelen gépe.
# zönge, zörej, F1, F2, F3, F4, hangerő
# Diád alapú hullámforma.


== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
== Melyik hang(ok)nak van periodikus szakasza? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,2,7,8|pontozás=-}}
# Hogy a magánhangzók érthetőbbek legyenek.
# L
# Hogy ne legyen „huppogós” a beszéd.
# M
# Hogy a zárhangok érthetőbbek legyenek.
# Sz
# Hogy a réshangok érthetőbbek legyenek.
# F
# S
# H
# J
# Ny


== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
== Melyik hangnak a legmagasabb az F2 értéke? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# C-k
# I
# V-k
# A
# Nazálisok
# U
# Zárhangok
# E


== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
534. sor: 572. sor:
# Az első 256 komponensét.
# Az első 256 komponensét.
# Az első 512 komponensét.
# Az első 512 komponensét.
== Egy akusztikus jellemzővektor… ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# egy adott hosszúságú hangrészletet jellemez.
# egy teljes bemondást jellemez.
# egy teljes hangot jellemez.
# egy teljes szót jellemez.
== Mire jó a Gaussian Mixture Model (GMM)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Mindenre, amire a HMM is.
# Csak a HMM-mel kiegészítésben használható.
# Időillesztésre.
# Hasonlósági mérték számítására.
== A rejtett Markov modelleket (HMM)... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# minden esetben helyettesíthetjük Markov láncokkal.
# a Viterbi-algoritmussal taníthatjuk be.
# a GMM-ekkel együtt lehet beszédfelismerésre használni.
# csak a GMM-mel kiegészítésben használhatjuk bármi is.
== A Viterbi-algoritmus… ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# a GMM paraméterek gyors közelítő számítására használható.
# a HMM paraméterek gyors közelítő számítására használható.
# adja meg a beszédfelismerésnél a helyes eredményt.
# a HMM legjobb illeszkedésű útvonalát mindig megtalálja.
== Melyik állítás(ok) igaz(ak)? ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# Beszédre csak lineáris kvantálást használunk.
# LPC-10 kódoló csak a zöngés részt kódolja.
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# A-törvényű (A-law) kvantálás lineáris.
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# Logaritmikus kvantálás veszteségmentesen visszaállítható.
== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
# Hangszalagok
# Szájüreg
# Orrüreg
# Garat
# Tüdő
# Nyelv
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 19 diád
# 5 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád


== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
599. sor: 582. sor:
# 18 kHz / 99 dB
# 18 kHz / 99 dB


== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszéddetektáló rendszer.
 
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 375 ms
# Korpusz alapú elem összefűzős rendszer.
# 280 ms
# Diád építőelemes beszédszintetizáló rendszer.
# 350 ms
# Formás szintézis.
# 325 ms
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
# 200 ms
 
# 240 ms
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszéddetektáló rendszer.


== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
== Melyik nem játszik közvetlen szerepet a hallásban? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Magánhangzót látunk.
# Eustach-kürt
# Zajt látunk.
# Kalapács
# Zöngétlen hangot látunk.
# Patkó
# Zárhangot látunk.
# Dobhártya
# Mássalhangzót látunk.
# Kasza
# Zöngés hangot látunk.
# Üllő


== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
== Melyik szinusz jelet halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 1670 Hz
# 40 Hz-es 45 dB
# 600 Hz
# 1 kHz-es 50 dB
# 2980 Hz
# 2 kHz-es 49 dB
# 500 Hz
# 10 kHz-es 51 dB
# 550 Hz
# 100 Hz


== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# -1
# 40 Hz-es 45 dB
# -2
# 1 kHz-es 50 dB
# -6
# 2 kHz-es 49 dB
# -3
# 10 kHz-es 51 dB
# -4
# -5


== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# egó
# 40 Hz-es 45 dB
# lás
# 1 kHz-es 50 dB
# sen
# 2 kHz-es 49 dB
# átp
# 10 kHz-es 51 dB
# csók
# rak


== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! hangsorban, ha azt egy nő ejti ki? ==
== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 200 ms
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# 1 ms
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# 100 μs
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# 4 ms
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# 40 ms
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.
# 400 μs


== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
# Módosíthatja a hangidőtartamot.
# MFCC paramétereket számolunk vele.
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# Megszünteti a frekvenciaelfedés jelenséget.
# Módosítható vele a mintavételi frekvencia.
# Beszédfelismerésben használt.


== LPC analízisnél előállított maradékjelre mi jellemző? ==
== Melyik állítás(ok) igaz(ak)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# Kinyerhetők belőle a formánsfrekvencia értékek.
# Beszédre csak lineáris kvantálást használunk.
# Több biten kvantálható, mint az eredeti jel.
# LPC-10 kódoló csak a zöngés részt kódolja.
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# A-törvényű (A-law) kvantálás lineáris.
# Eldobható az eredeti jel enélkül is visszaállítható.
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# Nagyobb az energiája az eredeti jelnél.
# Logaritmikus kvantálás veszteségmentesen visszaállítható.


== Mely hang(ok) zöngétlen(ek)? ==
== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# d
# PAMPA
# cs
# SAMPA
# l
# PUMPA
# dz
# SAMBA
# v
# g


== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# 20 – 20 000 Hz
# Normál beszéd 1m-ről.
# 30 – 3400 Hz
# Sugárhajtású repülő hajtóműve 15m-ről.
# 6000 – 10 000 Hz
# Suttogó beszéd 10m-ről.
# 300 – 4000 Hz
# Elhaladó vonat 2m-ről.
# 1000 – 7000 Hz
# Erős közúti forgalom 1m-ről.


== Mi a Tacotron 2? ==
== Mi a Tacotron 2? ==
698. sor: 698. sor:
# Egy HMM alapú hullámforma generáló rendszer.
# Egy HMM alapú hullámforma generáló rendszer.
# End-to-end rendszer.
# End-to-end rendszer.
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# kb. 135 Hz
# kb. 320 Hz
# kb. 65 Hz
# kb. 200 Hz
# kb. 220 Hz
# kb. 35 Hz
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# 1800 μs
# 45 s
# 30 s
# 900 ms
# 2000 ms
# 5800 μs
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# 6 * 6 + 18 * 18
# 24 * 24 + 18 * 5 * 5
# 24 * 24 * 24
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 26 * 26 * 26 + 10 * 10 * 10
# 36 * 36 + 26 * 10 * 10
# 36 * 36 + 10 * 26 * 26
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 7 * 19 * 26
# 19 * 19 * 19 + 7 * 7 * 7
# 26 * 26
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 78 dBA
# 800 dBA
# 18 dBA
# 138 dBA
# 8 dBA
# -18 dBA


== Mi a WaveNet? ==
== Mi a WaveNet? ==
808. sor: 709. sor:
# Egy mély neurális háló alapú hullámforma generáló rendszer.
# Egy mély neurális háló alapú hullámforma generáló rendszer.


== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
== Mi az akusztikai dB mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 Hz - 30 Hz
# W/m2
# 20 kHz - 30 kHz
# N/m2
# 10 Hz - 20 Hz
# M/s2
# 15 kHz - 20 kHz
# Mértékegység nélküli.
# 50 Hz - 5 kHz
 
# 5 kHz - 10 kHz
== Mi hangnyomás mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# W/m2
# N/m2
# M/s2
# Mértékegység nélküli.


== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,6|pontozás=-}}
# 20 Hz - 30 Hz
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# 20 kHz - 30 kHz
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# 10 Hz - 20 Hz
# Lineáris predikciós kódolás.
# 3 kHz - 10 kHz
# Erős háttérzaj a beszéd felvétele közben.
# 50 Hz - 5 kHz
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# 5 kHz - 10 kHz
# A bemeneti aluláteresztő szűrő hiánya.


== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
== Mi igaz az F0, F1, F2 értékekre? ==
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# F1 és F2 gyakorlatilag független F0-tól.
# Nagy energiájú hang lesz.
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# Felpattanás a hang elejére kerül.  
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# Több mint 100 ms hosszú a "p" hang.
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.


== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
== Mi jellemző a "p" hangra? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Zöngés.
# Nagy energiájú hang lesz.
# Zárhang.
# Felpattanás a hang elejére kerül.  
# Felpattanás a hang elején található.
# Több mint 100 ms hosszú a "t" hang.
# F2 értéke magas.
# A némafázisa nem hosszabb mint 100 μs.
# Nazális.
# Fojtott zönge legalább 100 ms lesz.
# Fojtott zöngét tartalmaz.


== Mi jellemző a formánsokra? ==
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,4,8,10|pontozás=-}}
# A néma fázisoknál is megmérhető.
# A néma fázisoknál is megmérhető.
# Értékük független a beszélő nemétől.
# Értékük független a beszélő nemétől.
852. sor: 756. sor:
# A magánhangzóknak 1440 db formánsa van.
# A magánhangzóknak 1440 db formánsa van.
# Vonalas spektrum esetén nem meghatározható.
# Vonalas spektrum esetén nem meghatározható.
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Nem csak az F0 egész számú többszöröse lehet.
# Nem csak az F0 egész számú többszöröse lehet.
860. sor: 761. sor:
# A hang spektrumából meghatározható.
# A hang spektrumából meghatározható.
# Nem függ a beszédhangtól.
# Nem függ a beszédhangtól.
# Vonalas spektrum esetén nem meghatározható.


== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
== Mi jellemző a μ-law kódolásra? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 200 Hz
# A HMM beszédfelismerés előfeldolgozója.
# 25 Hz
# μ meredekségű lineáris kvantálás.
# 400 Hz
# Négyzetes kvantálású.
# 100 Hz
# 8 bites lineáris kvantálás.
# 125 Hz
# Nagy amplitúdó esetén ritkább a kvantálás.
# 250 Hz
# MFCC paraméterei.


== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# kb. 140 Hz
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# kb. 200 Hz
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# kb. 70 Hz
# A zöngés hang zöngétlenedik.
# kb. 220 Hz
# A zöngés hang felhangosodik.
# kb. 320 Hz
# kb. 35 Hz


== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5900 μs
# Más lesz a felharmonikusok menete a mondat közepén.
# 900 ms
# Más az alapfrekvencia menete.
# 2500 μs
# Változatlan marad.
# 30 s
# Formánsok megváltoznak.
# 45 s
# 5800 ms


== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Módosíthatja a hangidőtartamot.
# A 'p' zöngétlen hang, a 'b' zöngés.
# MFCC paramétereket számolunk vele.
# Csak a ’p’-nek vannak zajkomponensei.
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# Megszünteti a frekvenciaelfedés jelenséget.
# Csak a zajkomponensek frekvenciahelyei térnek el.
# Módosítható vele a mintavételi frekvencia.
# Beszédfelismerésben használt.


== Mely hang(ok) zöngétlen(ek)? ==
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# g
# Szép, természetes hangzás.
# zs
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# d
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# dz
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# z
# k


== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Szép, természetes hangzás.
# Normál beszéd 1m-ről.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Suttogó beszéd 10m-ről.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.


== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 10 000 bsp
# Jel-idő függvény alapon.
# 480 bps
# LPC alapú TTS-en.
# 4800 bps
# Időtengely alapon.
# 1000 bps
# Frekvencia-jel függvény alapon.
# 48 bps
 
# 48 000 bps
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.


== Mi jellemző a μ-law kódolásra? ==
== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# A HMM beszédfelismerés előfeldolgozója.
# HMM alapú statisztikai parametrikus TTS.
# μ meredekségű lineáris kvantálás.
# Diád alapú hullámforma összefűzéses TTS.
# Négyzetes kvantálású.
# LPC alapú TTS.
# 8 bites lineáris kvantálás.
# Kempelen beszélő gépe.
# Nagy amplitúdó esetén ritkább a kvantálás.
# MFCC paraméterei.


== Mi jellemző a "p" hangra? ==
== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Zöngés.
# 20 Hz - 30 Hz
# Zárhang.
# 20 kHz - 30 kHz
# Felpattanás a hang elején található.
# 10 Hz - 20 Hz
# F2 értéke magas.
# 3 kHz - 10 kHz
# Nazális.
# 50 Hz - 5 kHz
# Fojtott zöngét tartalmaz.
# 5 kHz - 10 kHz


== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# 20 Hz - 30 Hz
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# 20 kHz - 30 kHz
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# 10 Hz - 20 Hz
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# 15 kHz - 20 kHz
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. az "alma" és a "körte" bemondások hasonlósága számítható.
# 50 Hz - 5 kHz
# 5 kHz - 10 kHz


== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# 5900 μs
# Csak a mássalhangzók maradnak meg.
# 900 ms
# Veszteségmentesen tárolható.
# 2500 μs
# Alig érhető marad a beszéd.
# 30 s
# Csak az alapfrekvencia marad meg.
# 45 s
# Majdnem tökéletesen megmarad a beszéd.
# 5800 ms
 
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# 1800 μs
# 45 s
# 30 s
# 900 ms
# 2000 ms
# 5800 μs


== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
969. sor: 872. sor:
# 10 hang
# 10 hang


== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
# Csak 6 bit alatti kvantálásnál létezik.
# 200 ms
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# 1 ms
# Függ a mintavételi frekvenciától.
# 100 μs
# Csak logaritmikus kvantálásnál jelentkezik.
# 4 ms
# Függ a kvantálási lépcsők számától.
# 40 ms
# Lineáris kvantálásnál is létezik.
# 400 μs
 
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 78 dBA
# 800 dBA
# 18 dBA
# 138 dBA
# 8 dBA
# -18 dBA
 
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 16 kHz
# 8 kHz
# 1 kHz
# 2 kHz
 
== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# F0, F1, F2, F3
# B1, B2, B3, F0, F1, F2, F3
# Zönge, zörej, F0, F1, F2, F3, hangerő
# Zönge, zörej, F1, F2, F3, F4, hangerő


== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) ==
== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
{{kvízkérdés|típus=egy|válasz=|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 1000
# F0, F1, F2, F3
# 5
# B1, B2, B3, B4, B5
# 13
# Zönge, zörej, F0, F1, F2, F3, hangerő
# 200
# Zönge, zörej, F1, F2, F3, F4, hangerő
# 16 000
# 80


== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)==
== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# MP3 kódolás.
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# Egy réshang részletét látjuk.
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Fojtott zöngét látunk.
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# A zaj kimaszkolta a jelet.
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.


== Melyik hang(ok)nak van periodikus szakasza? ==
== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
{{kvízkérdés|típus=több|válasz=1,2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# l
# Folytonos
# m
# Vonalas
# sz
# Elkent
# f
# Felkent
# s
# h


== Melyik hang(ok)nak van periodikus szakasza? ==
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# f
# 32
# j
# 20
# h
# 3
# ny
# 7
# s
# sz


== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== Mire jó a Gaussian Mixture Model (GMM)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# Mindenre, amire a HMM is.
# 4 kHz-en
# Csak a HMM-mel kiegészítésben használható.
# 3,5 kHz-en
# Időillesztésre.
# 7 kHz-en
# Hasonlósági mérték számítására.
# 1 kHz-en
 
# Sehol, mert kiszűrésre kerül.
== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Hogy a magánhangzók érthetőbbek legyenek.
# Hogy ne legyen „huppogós” a beszéd.
# Hogy a zárhangok érthetőbbek legyenek.
# Hogy a réshangok érthetőbbek legyenek.
 
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
 
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
 
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4


== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# 375 ms
# 4 kHz-en
# 280 ms
# 3,5 kHz-en
# 350 ms
# 7 kHz-en
# 325 ms
# 1 kHz-en
# 200 ms
# Sehol, mert kiszűrésre kerül.
# 240 ms
 
== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 180
# 200
# 256
# 25


== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)==
== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Fojtott zöngét látunk.
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# Egy réshang részletét látjuk.
# átlapolódást (aliasing) kivédtük.
# Túl kvantálási szint van.
# A hangminőség a telefonosnál biztosan jobb lesz.
# A zaj kimaszkolta a jelet.
# Többnyire érthető, de zajos lesz a jel.
# MP3 kódolás hibája.
# Biztosan érthetetlen, használhatatlan lesz a kimenet.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

A lap 2023. november 16., 16:39-kori változata


ZH felkészítő
Statisztika
Átlagteljesítmény
-
Eddigi kérdések
0
Kapott pontok
0
Alapbeállított pontozás
(-)
-
Beállítások
Minden kérdés látszik
-
Véletlenszerű sorrend
-
-


10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású repülő hajtóműve 15m-ről.
  4. Suttogó beszéd 10m-ről.
  5. Elhaladó vonat 2m-ről.
  6. Erős közúti forgalom 1m-ről.

16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel?

Típus: egy. Válasz: 6. Pontozás: -.

  1. Érthetetlen lesz az átlapolódás miatt.
  2. Csak a mássalhangzók maradnak meg.
  3. Veszteségmentesen tárolható.
  4. Alig érhető marad a beszéd.
  5. Csak az alapfrekvencia marad meg.
  6. Majdnem tökéletesen megmarad a beszéd.

60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: több. Válasz: 2. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású repülő hajtóműve 15m-ről.
  4. Suttogó beszéd 10m-ről.
  5. Elhaladó vonat 2m-ről.
  6. Erős közúti forgalom 1m-ről.

A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. 7 triád
  2. 15 diád
  3. 19 diád
  4. 5 diád + 7 triád
  5. 10 diád + 10 triád
  6. 3 diád + 8 triád

A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 1,4. Pontozás: -.

  1. A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "p" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 4. Pontozás: -.

  1. A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "t" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

A Viterbi-algoritmus…

Típus: egy. Válasz: 4. Pontozás: -.

  1. A GMM paraméterek gyors közelítő számítására használható.
  2. A HMM paraméterek gyors közelítő számítására használható.
  3. Adja meg a beszédfelismerésnél a helyes eredményt.
  4. A HMM legjobb illeszkedésű útvonalát mindig megtalálja.

A felharmonikusok definíció szerint…

Típus: egy. Válasz: 2. Pontozás: -.

  1. Megegyeznek a formánsok középfrekvenciáival.
  2. Az alapfrekvencia egész számú többszörösei.
  3. A rezonátorüreg által felerősített felhangnyalábok.
  4. Az alapfrekvencia páratlan, egészszámú többszörösei.

A felharmonikusok és az alapfrekvencia között milyen összefüggés van?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az alapfrekvenciát a felharmonikusokkal maradék nélkül tudjuk osztani.
  2. A felharmonikusok az alapfrekvencia egész számú többszörösei.
  3. A felharmonikusok az alapfrekvenciának mindig a kétszerese.
  4. Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.

A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Forrás-szűrő.
  2. Jel-szűrő.
  3. Frekvencia-szűrő.
  4. Intenzitás-szűrő.

A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél?

Típus: egy. Válasz: 2. Pontozás: -.

  1. C-k
  2. V-k
  3. Nazálisok
  4. Zárhangok

A kvantálás(t)...

Típus: egy. Válasz: 2. Pontozás: -.

  1. Lépésköze függ a mintavételi frekvenciától.
  2. Lépésköze nem függ a mintavételi frekvenciától.
  3. Veszteségmentesen visszaállítható.
  4. Lépésköze nem befolyásolja a hangminőséget.
  5. Csak egyenletes közökkel használják beszédre.
  6. Függ a beszéd alapfrekvenciájától.

A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?

Típus: több. Válasz: 1,7. Pontozás: -.

  1. Kb. 135 Hz
  2. Kb. 320 Hz
  3. Kb. 65 Hz
  4. Kb. 200 Hz
  5. Kb. 220 Hz
  6. Kb. 35 Hz
  7. Kb. 140 Hz
  8. Kb. 70 Hz

A rejtett Markov modelleket (HMM)...

Típus: egy. Válasz: 3. Pontozás: -.

  1. Minden esetben helyettesíthetjük Markov láncokkal.
  2. A Viterbi-algoritmussal taníthatjuk be.
  3. A GMM-ekkel együtt lehet beszédfelismerésre használni.
  4. Csak a GMM-mel kiegészítésben használhatjuk bármi is.

A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta:

Típus: egy. Válasz: 3. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang:

Típus: egy. Válasz: 4. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang:

Típus: egy. Válasz: 1. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A “hasát” szóban milyen hang található?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Réshang
  4. Zöngés zárhang

A “sás” szót kiejtve milyen rész található a beszédjelben?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Zöngés rész
  4. Zöngés zárhang

A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia?

Típus: egy. Válasz: 1. Pontozás: -.

  1. á
  2. Záró „k”
  3. U
  4. A

A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. A b felpattanás elé szünetet kell beiktatni.
  2. A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
  3. A b előtti zár szakaszt csendre kell cserélni.
  4. Nem megvalósítható.

Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz!

Típus: több. Válasz: 1,2,4. Pontozás: -.

  1. Szöveg gyűjtése.
  2. Hang felvétele mester mondattal.
  3. Szótagokra vágás.
  4. Fonetikai átirat és hanghatár bejelölése minden mondatra.

Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Annotálás és szegmentálás.
  2. Szupraszegmentálás és koartikuláció.
  3. Koartikuláció és annotálás.
  4. Egyik sem.

Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Sz
  2. K
  3. T
  4. D

Az alábbiak közül melyik segít a beszédhangok határainak jelölésében?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Spektogram.
  2. Intenzitás-idő függvény.
  3. Felvétel meghallgatása.
  4. Mindegyik segít benne.

Az annotálás...

Típus: egy. Válasz: 2. Pontozás: -.

  1. A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
  2. A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
  3. A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
  4. A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 10 000 bsp
  2. 480 bps
  3. 4800 bps
  4. 1000 bps
  5. 48 bps
  6. 48 000 bps

Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?

Típus: több. Válasz: 3,6. Pontozás: -.

  1. 1670 Hz
  2. 600 Hz
  3. 2980 Hz
  4. 500 Hz
  5. 550 Hz
  6. 100 Hz

Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 0,5 kHz-es szinuszjel.
  2. 2 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1 kHz-es szinuszjel.

Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 3,1 kHz-es szinuszjel.
  2. 1,7 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1,7 és 3,1 kHz-es szinuszjel.

Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 120 dB
  2. 63 dB
  3. 60 dB
  4. 90 dB

Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Normál beszéd 1 m-ről.
  2. Sugárhajtású gép hajtóműve 5 m-ről.
  3. Haladó kamion 2 m-ről.
  4. Papírlap susogása 1 m-ről.

Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy akusztikus jellemzővektor…

Típus: egy. Válasz: 1. Pontozás: -.

  1. Egy adott hosszúságú hangrészletet jellemez.
  2. Egy teljes bemondást jellemez.
  3. Egy teljes hangot jellemez.
  4. Egy teljes szót jellemez.

Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 6 dB
  2. -6 dB
  3. 3 dB
  4. -3 dB

Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?

Típus: több. Válasz: 6. Pontozás: -.

  1. Magánhangzót látunk.
  2. Zajt látunk.
  3. Zöngétlen hangot látunk.
  4. Zárhangot látunk.
  5. Mássalhangzót látunk.
  6. Zöngés hangot látunk.

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2. Pontozás: -.

  1. Fojtott zöngét látunk.
  2. Egy réshang részletét látjuk.
  3. Túl kvantálási szint van.
  4. A zaj kimaszkolta a jelet.
  5. MP3 kódolás hibája.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2, 5. Pontozás: -.

  1. MP3 kódolás.
  2. Egy réshang részletét látjuk.
  3. Fojtott zöngét látunk.
  4. A zaj kimaszkolta a jelet.
  5. Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Profi bemondó, változatos hanganyag.
  2. Több beszélő, szavak felolvasása.
  3. Egy bemondó, egy hang kitartása.
  4. Egyik sem.

Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása?

Típus: több. Válasz: 3. Pontozás: -.

  1. -1
  2. -2
  3. -6
  4. -3
  5. -4
  6. -5

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 176 kByte
  4. 88 kByte

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 88 kByte
  4. 132 kByte

Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 6. Pontozás: -.

  1. 6 * 6 + 18 * 18
  2. 24 * 24 + 18 * 5 * 5
  3. 24 * 24 * 24
  4. 6 * 18 * 24
  5. 24 * 24
  6. 24 * 24 + 6 * 18 * 18

Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 7 * 19 * 26
  2. 19 * 19 * 19 + 7 * 7 * 7
  3. 26 * 26
  4. 26 * 26 + 7 * 19 * 19
  5. 26 * 26 + 26 * 26 * 26
  6. 26 * 26 * 26

Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 26 * 26 * 26 + 10 * 10 * 10
  2. 36 * 36 + 26 * 10 * 10
  3. 36 * 36 + 10 * 26 * 26
  4. 36 * 36 * 36
  5. 36 * 36
  6. 10 * 10 + 26 * 26

Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?

Típus: több. Válasz: 6. Pontozás: -.

  1. 2400 Hz
  2. 200 kHz
  3. 12 Hz
  4. 120 Hz
  5. 25 Hz
  6. Nem tudjuk megállapítani.

Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. 200 Hz
  2. 25 Hz
  3. 400 Hz
  4. 100 Hz
  5. 125 Hz
  6. 250 Hz

Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*)

Típus: egy. Válasz: . Pontozás: -.

  1. 1000
  2. 5
  3. 13
  4. 200
  5. 16 000
  6. 80

Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
  2. Azonos életkorú beszélőkkel készítjük a felvételeket.
  3. Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
  4. Kevés jól megválasztott szó felolvasása is elegendő.
  5. Különböző korú és nemű emberrel is érdemes felvételt készíteni
  6. Csak studió körülmények között felvett beszédet lehet használni.

Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.”

Típus: egy. Válasz: 4. Pontozás: -.

  1. 10 Hz
  2. 100 Hz
  3. 20 Hz
  4. 70 Hz

Hogy hívják az egyenlő hangosság érzetű görbét?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Phon
  2. Phön
  3. Schön
  4. Decibel

Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Személyfüggő kapcsolat van.
  2. Függetlenek tőle.
  3. Az alapfrekvencia egészszámú többszöröseinél vannak.
  4. Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.

Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Zönge
  2. Zengő
  3. Vokál
  4. Spektrál

Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Felharmonikus
  2. Alapfrekvencia
  3. Formáns
  4. Oktáv

Hogyan változik meg egy felpattanó zárhang nyújtáskor?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Az energiája megnő.
  2. Megismétlődik a felpattanó rész.
  3. Zárrész megnyúlik.
  4. Megnő az alapfrekvenciája.

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?

Típus: több. Válasz: 1,7. Pontozás: -.

  1. 1600
  2. 10 000
  3. 256
  4. 64
  5. 39 * 39 * 39
  6. 25 + 14
  7. 39 * 39
  8. 25 * 25 * 14 + 25 * 25

Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Típus: egy. Válasz: 1. Pontozás: -.

  1. Igaz
  2. Hamis

Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge?

Típus: több. Válasz: 1. Pontozás: -.

  1. Egó
  2. Lás
  3. Sen
  4. átp
  5. Csók
  6. Rak

LPC analízisnél előállított maradékjelre mi jellemző?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Kinyerhetők belőle a formánsfrekvencia értékek.
  2. Több biten kvantálható, mint az eredeti jel.
  3. Az a jel a maradékjel, ami nem fért bele az analízisablakba.
  4. LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
  5. Eldobható az eredeti jel enélkül is visszaállítható.
  6. Nagyobb az energiája az eredeti jelnél.

Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 168
  2. 10
  3. 40
  4. 2

Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?

Típus: több. Válasz: 1,5. Pontozás: -.

  1. Hangszalagok
  2. Szájüreg
  3. Orrüreg
  4. Garat
  5. Tüdő
  6. Nyelv

Mely hang(ok) zöngétlen(ek)?

Típus: több. Válasz: 2,9. Pontozás: -.

  1. D
  2. Cs
  3. L
  4. Dz
  5. V
  6. G
  7. Zs
  8. Z
  9. K

Mely állítás(ok) igaz(ak) a kvantálási zajra?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. Csak 6 bit alatti kvantálásnál létezik.
  2. Értéke nem meghatározható, mert a használt mikrofontól függ.
  3. Függ a mintavételi frekvenciától.
  4. Csak logaritmikus kvantálásnál jelentkezik.
  5. Függ a kvantálási lépcsők számától.
  6. Lineáris kvantálásnál is létezik.

Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. HMM statisztikai TTS.
  2. WaveNet TTS.
  3. Kempelen gépe.
  4. Diád alapú hullámforma.

Melyik hang(ok)nak van periodikus szakasza?

Típus: több. Válasz: 1,2,7,8. Pontozás: -.

  1. L
  2. M
  3. Sz
  4. F
  5. S
  6. H
  7. J
  8. Ny

Melyik hangnak a legmagasabb az F2 értéke?

Típus: egy. Válasz: 1. Pontozás: -.

  1. I
  2. A
  3. U
  4. E

Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az első 226 komponensét.
  2. Az első 128 komponensét.
  3. Az első 256 komponensét.
  4. Az első 512 komponensét.

Melyik koszinusz jelnek a legkisebb az intenzitása?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 7000 Hz / 65 phon
  2. 1 kHz / 60 db
  3. 1000 Hz/ 61 phon
  4. 20 Hz / 59 phon
  5. 500 Hz / 120 dB
  6. 18 kHz / 99 dB

Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Melyik nem játszik közvetlen szerepet a hallásban?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Eustach-kürt
  2. Kalapács
  3. Patkó
  4. Dobhártya
  5. Kasza
  6. Üllő

Melyik szinusz jelet halljuk a leghangosabbnak?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelnek a legnagyobb az intenzitása?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelnek legkisebb az intenzitása?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?

Típus: egy. Válasz: 5. Pontozás: -.

  1. Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
  2. A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
  3. Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
  4. Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
  5. Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.

Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?

Típus: több. Válasz: 1,3. Pontozás: -.

  1. Módosíthatja a hangidőtartamot.
  2. MFCC paramétereket számolunk vele.
  3. Pitch Synchronous Overlap and Add-nek a rövidítése.
  4. Megszünteti a frekvenciaelfedés jelenséget.
  5. Módosítható vele a mintavételi frekvencia.
  6. Beszédfelismerésben használt.

Melyik állítás(ok) igaz(ak)?

Típus: több. Válasz: 5. Pontozás: -.

  1. Beszédre csak lineáris kvantálást használunk.
  2. LPC-10 kódoló csak a zöngés részt kódolja.
  3. MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
  4. A-törvényű (A-law) kvantálás lineáris.
  5. A beszédkódolók minősége nem csak a bitsebességtől függ.
  6. Logaritmikus kvantálás veszteségmentesen visszaállítható.

Melyiket használjuk az alábbiak közül betű-hang átalakításra?

Típus: egy. Válasz: 2. Pontozás: -.

  1. PAMPA
  2. SAMPA
  3. PUMPA
  4. SAMBA

Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 – 20 000 Hz
  2. 30 – 3400 Hz
  3. 6000 – 10 000 Hz
  4. 300 – 4000 Hz
  5. 1000 – 7000 Hz

Mi a Tacotron 2?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy beszédfelismerő eszköz.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

Mi a WaveGlow?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy folyamat alapú beszédgeneráló rendszer.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

Mi a WaveNet?

Típus: több. Válasz: 3,5,7. Pontozás: -.

  1. Ultrahangos beszédrögzítő készülék.
  2. Egy beszédátvitelt szabványosító szervezet.
  3. Egy hullámforma generáló rendszer, amely gépi tanuláson alapul.
  4. Beszéd alapú helymeghatározási megoldás.
  5. Egy DNN alapú hullámforma generáló rendszer.
  6. Egy HMM alapú hullámforma generáló rendszer.
  7. Egy mély neurális háló alapú hullámforma generáló rendszer.

Mi az akusztikai dB mértékegysége?

Típus: egy. Válasz: 4. Pontozás: -.

  1. W/m2
  2. N/m2
  3. M/s2
  4. Mértékegység nélküli.

Mi hangnyomás mértékegysége?

Típus: egy. Válasz: 2. Pontozás: -.

  1. W/m2
  2. N/m2
  3. M/s2
  4. Mértékegység nélküli.

Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?

Típus: több. Válasz: 1,6. Pontozás: -.

  1. A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
  2. A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
  3. Lineáris predikciós kódolás.
  4. Erős háttérzaj a beszéd felvétele közben.
  5. A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
  6. A bemeneti aluláteresztő szűrő hiánya.

Mi igaz az F0, F1, F2 értékekre?

Típus: egy. Válasz: 1. Pontozás: -.

  1. F1 és F2 gyakorlatilag független F0-tól.
  2. F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
  3. F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
  4. F0 a nulladik formáns, F1 az első, F2 pedig a második.

Mi jellemző a "p" hangra?

Típus: több. Válasz: 2. Pontozás: -.

  1. Zöngés.
  2. Zárhang.
  3. Felpattanás a hang elején található.
  4. F2 értéke magas.
  5. Nazális.
  6. Fojtott zöngét tartalmaz.

Mi jellemző a formánsokra?

Típus: több. Válasz: 3,4,8,10. Pontozás: -.

  1. A néma fázisoknál is megmérhető.
  2. Értékük független a beszélő nemétől.
  3. Az F2 meghatározza a magánhangzó hangrendjét.
  4. Az alapfrekvenciánál nagyobb az értékük.
  5. A magánhangzóknak 1440 db formánsa van.
  6. Vonalas spektrum esetén nem meghatározható.
  7. Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
  8. Nem csak az F0 egész számú többszöröse lehet.
  9. A magánhangzók 1140 db formánsa van.
  10. A hang spektrumából meghatározható.
  11. Nem függ a beszédhangtól.

Mi jellemző a μ-law kódolásra?

Típus: egy. Válasz: 5. Pontozás: -.

  1. A HMM beszédfelismerés előfeldolgozója.
  2. μ meredekségű lineáris kvantálás.
  3. Négyzetes kvantálású.
  4. 8 bites lineáris kvantálás.
  5. Nagy amplitúdó esetén ritkább a kvantálás.
  6. MFCC paraméterei.

Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
  2. Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
  3. A zöngés hang zöngétlenedik.
  4. A zöngés hang felhangosodik.

Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Más lesz a felharmonikusok menete a mondat közepén.
  2. Más az alapfrekvencia menete.
  3. Változatlan marad.
  4. Formánsok megváltoznak.

Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől?

Típus: egy. Válasz: 1. Pontozás: -.

  1. A 'p' zöngétlen hang, a 'b' zöngés.
  2. Csak a ’p’-nek vannak zajkomponensei.
  3. A ’b’ időben összetett szerkezetű, a ’p’ nem.
  4. Csak a zajkomponensek frekvenciahelyei térnek el.

Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre?

Típus: több. Válasz: 1,2,3. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Jel-idő függvény alapon.
  2. LPC alapú TTS-en.
  3. Időtengely alapon.
  4. Frekvencia-jel függvény alapon.

Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  2. 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  4. 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.

Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. HMM alapú statisztikai parametrikus TTS.
  2. Diád alapú hullámforma összefűzéses TTS.
  3. LPC alapú TTS.
  4. Kempelen beszélő gépe.

Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz - 30 kHz
  3. 10 Hz - 20 Hz
  4. 3 kHz - 10 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma?

Típus: egy. Válasz: 5. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz - 30 kHz
  3. 10 Hz - 20 Hz
  4. 15 kHz - 20 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni."

Típus: egy. Válasz: 6. Pontozás: -.

  1. 5900 μs
  2. 900 ms
  3. 2500 μs
  4. 30 s
  5. 45 s
  6. 5800 ms

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség."

Típus: több. Válasz: 5. Pontozás: -.

  1. 1800 μs
  2. 45 s
  3. 30 s
  4. 900 ms
  5. 2000 ms
  6. 5800 μs

Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk.

Típus: egy. Válasz: 5. Pontozás: -.

  1. 4 hang
  2. 9 hang
  3. 3 hang
  4. 6 hang
  5. 5 hang
  6. 10 hang

Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki?

Típus: több. Válasz: 4. Pontozás: -.

  1. 200 ms
  2. 1 ms
  3. 100 μs
  4. 4 ms
  5. 40 ms
  6. 400 μs

Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 78 dBA
  2. 800 dBA
  3. 18 dBA
  4. 138 dBA
  5. 8 dBA
  6. -18 dBA

Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 16 kHz
  2. 8 kHz
  3. 1 kHz
  4. 2 kHz

Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, F0, F1, F2, F3
  3. Zönge, zörej, F0, F1, F2, F3, hangerő
  4. Zönge, zörej, F1, F2, F3, F4, hangerő

Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság)

Típus: egy. Válasz: 2. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, B4, B5
  3. Zönge, zörej, F0, F1, F2, F3, hangerő
  4. Zönge, zörej, F1, F2, F3, F4, hangerő

Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  2. 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  4. 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.

Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Folytonos
  2. Vonalas
  3. Elkent
  4. Felkent

Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 32
  2. 20
  3. 3
  4. 7

Mire jó a Gaussian Mixture Model (GMM)?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Mindenre, amire a HMM is.
  2. Csak a HMM-mel kiegészítésben használható.
  3. Időillesztésre.
  4. Hasonlósági mérték számítására.

Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Hogy a magánhangzók érthetőbbek legyenek.
  2. Hogy ne legyen „huppogós” a beszéd.
  3. Hogy a zárhangok érthetőbbek legyenek.
  4. Hogy a réshangok érthetőbbek legyenek.

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 375 ms
  2. 280 ms
  3. 350 ms
  4. 325 ms
  5. 200 ms
  6. 240 ms

Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 180
  2. 200
  3. 256
  4. 25

Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva...

Típus: egy. Válasz: 4. Pontozás: -.

  1. 9 kHz körüli beszédkomponens biztosan kiszűrthető.
  2. átlapolódást (aliasing) kivédtük.
  3. A hangminőség a telefonosnál biztosan jobb lesz.
  4. Többnyire érthető, de zajos lesz a jel.
  5. Biztosan érthetetlen, használhatatlan lesz a kimenet.