„ZH felkészítést segítő kvíz” változatai közötti eltérés

A VIK Wikiből
Csia Klaudia Kitti (vitalap | szerkesztései)
a Javítás.
 
(26 közbenső módosítás, amit 2 másik szerkesztő végzett, nincs mutatva)
1. sor: 1. sor:
{{Vissza|Beszéd-információs_rendszerek}}
{{Vissza|Beszéd-információs_rendszerek}}
{{kvízoldal|cím=ZH felkészítő|pontozás=-}}


Ez a kvíz a ZH felkészülést segíti elő, tanulást viszont nem helyettesít. A kérdések javarészt, általam kitaláltak, gyakorlatból kiszedették vagy épp KZH kérdések.  
== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
Amelyik kérdés végén (*) van, annak a válasza nem 100%, hogy helyes/ nincs rá még válasz, ezeket írjátok be ti nyugodtan, ha tudjátok rá a jó választ, illetve, ha találtok hibás megoldást, nyugodtan szerkesszétek át. Jó felkészülést kívánok!
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
 
== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# Csak a mássalhangzók maradnak meg.
# Veszteségmentesen tárolható.
# Alig érhető marad a beszéd.
# Csak az alapfrekvencia marad meg.
# Majdnem tökéletesen megmarad a beszéd.
 
== 20 dB hangnyomászintet mértünk. Mi lehetett a forrás? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Sírás 1 m-ről
# Fűnyíró 2 m-ről
# Kiabálás 3 m-ről
# Suttogás 0,5 m-ről
 
== 3,1 kHz-es szinuszjelet anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-2300Hz sávszűrő van. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 1,9 kHz szinusz
# 3,1 kHz szinusz
# 1,7 kHz szinusz
# 1,9 és 2,9 kHz szinusz
 
== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású gép hajtóműve 5 m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.
# Haladó kamion 2 m-ről.
# Papírlap susogása 1 m-ről.
 
== A "Kimegyünk?" mondat melyik hangjában a legnagyobb az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Első k
# N
# E
# I
# Ü
 
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 20 diád
# 6 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád


{{Kvízoldal
== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
|cím=ZH felkészítő
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "p" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.
 
== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Nagy energiájú hang lesz.
# Felpattanás a hang elejére kerül.
# Több mint 100 ms hosszú a "t" hang.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.
 
== A Viterbi-algoritmus… ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A GMM paraméterek gyors közelítő számítására használható.
# A HMM paraméterek gyors közelítő számítására használható.
# Adja meg a beszédfelismerésnél a helyes eredményt.
# A HMM legjobb illeszkedésű útvonalát mindig megtalálja.
 
== A felharmonikusok definíció szerint… ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Megegyeznek a formánsok középfrekvenciáival.
# Az alapfrekvencia egész számú többszörösei.
# A rezonátorüreg által felerősített felhangnyalábok.
# Az alapfrekvencia páratlan, egészszámú többszörösei.


== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? ==
15. sor: 102. sor:
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# t < 50 ms
# Forrás-szűrő.
# t = 50 ms
# Jel-szűrő.
# 50 < t < 100 ms
# Frekvencia-szűrő.
# 100 ms < t
# Intenzitás-szűrő.
 
== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# C-k
# V-k
# Nazálisok
# Zárhangok
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Lépésköze függ a mintavételi frekvenciától.
# Lépésköze nem függ a mintavételi frekvenciától.
# Veszteségmentesen visszaállítható.
# Lépésköze nem befolyásolja a hangminőséget.
# Csak egyenletes közökkel használják beszédre.
# Függ a beszéd alapfrekvenciájától.
 
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# Kb. 135 Hz
# Kb. 320 Hz
# Kb. 65 Hz
# Kb. 200 Hz
# Kb. 220 Hz
# Kb. 35 Hz
# Kb. 140 Hz
# Kb. 70 Hz
 
== A rejtett Markov modelleket (HMM)... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Minden esetben helyettesíthetjük Markov láncokkal.
# A Viterbi-algoritmussal taníthatjuk be.
# A GMM-ekkel együtt lehet beszédfelismerésre használni.
# Csak a GMM-mel kiegészítésben használhatjuk bármi is.


== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t
31. sor: 152. sor:
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# t < 50 ms  
# T < 50 ms
# t = 50 ms
# T = 50 ms
# 50 < t < 100 ms
# 50 < t < 100 ms
# 100 ms < t
# 100 ms < t


== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
== A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Igaz
# T < 50 ms
# Hamis
# T = 50 ms
# 50 < t < 100 ms
# 100 ms < t


== Az annotálás... ==
== A “hasát” szóban milyen hang található? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag  tartalmaz.
# Pergő rész
# a hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# Nazális
# a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Réshang
# a kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# Zöngés zárhang


== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# átlapolódást (aliasing) kivédtük.
# a hangminőség a telefonosnál biztosan jobb lesz.
# többnyire érthető, de zajos lesz a jel.
# biztosan érthetetlen, használhatatlan lesz a kimenet.
 
== A kvantálás(t)... ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# lépésköze függ a mintavételi frekvenciától.
# lépésköze nem függ a mintavételi frekvenciától.
# veszteségmentesen visszaállítható.
# lépésköze nem befolyásolja a hangminőséget.
# csak egyenletes közökkel használják beszédre.
# függ a beszéd alapfrekvenciájától.
 
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Pergő rész
# Diád építőelemes beszédszintetizáló rendszer.
# Nazális
# Formás szintézis.
# Zöngés rész
# Beszéddetektáló rendszer.
# Zöngés zárhang


== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# á
# Diád építőelemes beszédszintetizáló rendszer.
# Záró „k”
# Formás szintézis.
# U
# Beszéddetektáló rendszer.
# A


== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Szép, természetes hangzás.
# A b felpattanás elé szünetet kell beiktatni.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# A b előtti zár szakaszt csendre kell cserélni.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
# Nem megvalósítható.
 
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Korpusz alapú elem összefűzős rendszer.
# Diád építőelemes beszédszintetizáló rendszer.
# Formás szintézis.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
 
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# Szép, természetes hangzás.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.


== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! ==
114. sor: 199. sor:
# Fonetikai átirat és hanghatár bejelölése minden mondatra.
# Fonetikai átirat és hanghatár bejelölése minden mondatra.


== Mi hangnyomás mértékegysége? ==
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# W/m2
# Annotálás és szegmentálás.
# N/m2
# Szupraszegmentálás és koartikuláció.
# m/s2
# Koartikuláció és annotálás.
# Mértékegység nélküli.
# Egyik sem.


== Mi az akusztikai dB mértékegysége? ==
== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# W/m2
# Sz
# N/m2
# K
# m/s2
# T
# Mértékegység nélküli.
# D
# A


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Eustach-kürt
# Spektogram.
# Kalapács
# Intenzitás-idő függvény.
# Patkó
# Felvétel meghallgatása.
# Dobhártya
# Mindegyik segít benne.


== Melyik nem játszik közvetlen szerepet a hallásban? ==
== Az annotálás... ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Eustach-kürt
# Kalapács
# Kasza
# Üllő
 
== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 120 dB
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
# 63 dB
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
# 60 dB
# A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
# 90 dB
# A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.


== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 6 dB
# 10 000 bsp
# -6 dB
# 480 bps
# 3 dB
# 4800 bps
# -3 dB
# 1000 bps
# 48 bps
# 48 000 bps


== Hogy hívják az egyenlő hangosság érzetű görbét? ==
== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
# phon
# 1670 Hz
# phön
# 600 Hz
# schön
# 2980 Hz
# decibel
# 500 Hz
# 550 Hz
# 100 Hz


== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 40 Hz-es 45 dB
# 1 kHz-es 50 dB
# 2 kHz-es 49 dB
# 10 kHz-es 51 dB
 
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 0,5 kHz-es szinuszjel.
# 1 kHz-es 50 dB
# 2 kHz-es szinuszjel.
# 2 kHz-es 49 dB
# 3 kHz-es szinuszjel.
# 10 kHz-es 51 dB
# 1 kHz-es szinuszjel.


== Melyik szinusz jelet halljuk a leghangosabbnak? ==
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40 Hz-es 45 dB
# 3,1 kHz-es szinuszjel.
# 1 kHz-es 50 dB
# 1,7 kHz-es szinuszjel.
# 2 kHz-es 49 dB
# 3 kHz-es szinuszjel.
# 10 kHz-es 51 dB
# 1,7 és 3,1 kHz-es szinuszjel.


== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Normál beszéd 1 m-ről.
# Sugárhajtású gép hajtóműve 5 m-ről.
# Haladó kamion 2 m-ről.
# Papírlap susogása 1 m-ről.
 
== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Zönge
# Zengő
# Vokál
# Spektrál
 
== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Folytonos
# 120 dB
# Vonalas
# 63 dB
# Elkent
# 60 dB
# Felkent
# 90 dB


== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Felharmonikus
# 8 kHZ-en
# Alapfrekvencia
# 4 kHz-en
# Formáns
# 3,5 kHz-en
# Oktáv
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Személyfüggő kapcsolat van.
# 8 kHZ-en
# Függetlenek tőle.
# 4 kHz-en
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# 3,5 kHz-en
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.
# 7 kHz-en
# 1 kHz-en
# Sehol, mert kiszűrésre kerül.


== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
== Egy akusztikus jellemzővektor… ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A 'p' zöngétlen hang, a 'b' zöngés.
# Egy adott hosszúságú hangrészletet jellemez.
# Csak a ’p’-nek vannak zajkomponensei.
# Egy teljes bemondást jellemez.
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# Egy teljes hangot jellemez.
# Csak a zajkomponensek frekvenciahelyei térnek el.
# Egy teljes szót jellemez.


== A felharmonikusok definíció szerint… ==
== Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# megegyeznek a formánsok középfrekvenciáival.
# 6 dB
# az alapfrekvencia egész számú többszörösei.
# -6 dB
# a rezonátorüreg által felerősített felhangnyalábok.
# 3 dB
# az alapfrekvencia páratlan, egészszámú többszörösei.
# -3 dB


== Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? ==
== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# Spektogram.
# Magánhangzót látunk.
# Intenzitás-idő függvény.
# Zajt látunk.
# Felvétel meghallgatása.
# Zöngétlen hangot látunk.
# Mindegyik segít benne.
# Zárhangot látunk.
# Mássalhangzót látunk.
# Zöngés hangot látunk.


== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# PAMPA
# Fojtott zöngét látunk.
# SAMPA
# Egy réshang részletét látjuk.
# PUMPA
# Túl kvantálási szint van.
# SAMBA
# A zaj kimaszkolta a jelet.
# MP3 kódolás hibája.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.


== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? ==
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*) ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
# sz
# MP3 kódolás.
# k
# Egy réshang részletét látjuk.
# t
# Fojtott zöngét látunk.
# d
# A zaj kimaszkolta a jelet.
 
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
== Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? ==
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Annotálás és szegmentálás.
# Szupraszegmentálás és koartikuláció.
# Koartikuláció és annotálás.
# Egyik sem.


== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? ==
268. sor: 333. sor:
# Egyik sem.
# Egyik sem.


== A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? ==
== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
# Forrás-szűrő.
# -1
# Jel-szűrő.
# -2
# Frekvencia-szűrő.
# -6
# Intenzitás-szűrő.
# -3
# -4
# -5


== A “sás” szót kiejtve milyen rész található a beszédjelben? ==
== Egy másodperces beszéd mennyi helyet foglal 22kHz mintavételezés és 16 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Pergő rész
# 44 bájt
# Nazális
# 22 kbájt
# Zöngés rész
# 44 kbájt
# Zöngés zárhang
# 88 kbájt
 
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 88 Byte
# 44 kByte
# 176 kByte
# 88 kByte


== A “hasát” szóban milyen hang található? ==
== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Pergő rész
# 88 Byte
# Nazális
# 44 kByte
# Réshang
# 88 kByte
# Zöngés zárhang
# 132 kByte


== Mi igaz az F0, F1, F2 értékekre? ==
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# F1 és F2 gyakorlatilag független F0-tól.
# 6 * 6 + 18 * 18
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# 24 * 24 + 18 * 5 * 5
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# 24 * 24 * 24
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18


== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# 7 * 19 * 26
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# 19 * 19 * 19 + 7 * 7 * 7
# A zöngés hang zöngétlenedik.
# 26 * 26
# A zöngés hang felhangosodik.
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26


== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Az energiája megnő.
# 26 * 26 * 26 + 10 * 10 * 10
# Megismétlődik a felpattanó rész.
# 36 * 36 + 26 * 10 * 10
# Zárrész megnyúlik.
# 36 * 36 + 10 * 26 * 26
# Megnő az alapfrekvenciája.
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
 
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.


== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# Más lesz a felharmonikusok menete a mondat közepén.
# 200 Hz
# Más az alapfrekvencia menete.
# 25 Hz
# Változatlan marad.
# 400 Hz
# Formánsok megváltoznak.
# 100 Hz
# 125 Hz
# 250 Hz


== Melyik hangnak a legmagasabb az F2 értéke? ==
== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# i
# 1000
# a
# 5
# u
# 13
# e
# 200
# 16 000
# 80


== A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? ==
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# á
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Záró „k”
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# u
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# a
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.


== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” ==
338. sor: 433. sor:
# 70 Hz
# 70 Hz


== A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? ==
== Hogy hívják az egyenlő hangosság érzetű görbét? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A b felpattanás elé szünetet kell beiktatni.
# Phon
# A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
# Phön
# A b előtti zár szakaszt csendre kell cserélni.
# Schön
# Nem megvalósítható.
# Decibel


== Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? ==
== Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 0,5 kHz-es szinuszjel.
# 2 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1 kHz-es szinuszjel.
 
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 3,1 kHz-es szinuszjel.
# 1,7 kHz-es szinuszjel.
# 3 kHz-es szinuszjel.
# 1,7 és 3,1 kHz-es szinuszjel.
 
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Személyfüggő kapcsolat van.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Függetlenek tőle.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# Az alapfrekvencia egészszámú többszöröseinél vannak.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
# Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.


== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
== Hogyan lehet a kasza szóból kata szót készíteni hangsebészettel? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# Sehogy
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Az sz hang első 90%-át csendre kell cserélni
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# Az sz hang első felének amplitúdóját nullára kell állítani
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Az sz hang helyére fojtott zöngét kell egy másik bemondásból beállítani
# Az sz hangot ki kell vágni


== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
== Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 16 kHz
# Zönge
# 8 kHz
# Zengő
# 1 kHz
# Vokál
# 2 kHz
# Spektrál
# Surlódási zörej


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? ==
== Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Felharmonikus
# 44 kByte
# Alapfrekvencia
# 176 kByte
# Formáns
# 88 kByte
# Oktáv


== Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? ==
== Hogyan változik meg egy felpattanó zárhang nyújtáskor? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 88 Byte
# Az energiája megnő.
# 44 kByte
# Megismétlődik a felpattanó rész.
# 88 kByte
# Zárrész megnyúlik.
# 132 kByte
# Megnő az alapfrekvenciája.


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
401. sor: 484. sor:
# 16 bites
# 16 bites


== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? ==
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 8 bites
# 8 bites
# 12 bites
# 12 bites
408. sor: 491. sor:
# 16 bites
# 16 bites


== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
== Hány bites a lineáris kvantáló, ha a maximális kivezérlésű jel és a kvantálási zaj viszonya 96 dB? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# 4 bites
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# 8 bites
# Lineáris predikciós kódolás.
# 16 bites
# Erős háttérzaj a beszéd felvétele közben.
# 32 bites
 
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# A bemeneti aluláteresztő szűrő hiánya.
 
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 32
# 20
# 3
# 7


== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}}
# 1600
# 1600
# 10 000
# 10 000
# 256
# 256
# 64
# 64
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 39 * 39 * 39
# 39 * 39 * 39
# 25 + 14
# 25 + 14
443. sor: 509. sor:
# 25 * 25 * 14 + 25 * 25
# 25 * 25 * 14 + 25 * 25


== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
== Hány felharmonikus mérhető 4000 Hz-ig 200 Hz alapfrekvencia mellett? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM statisztikai TTS.
# 19
# WaveNet TTS.
# 20
# Kempelen gépe.
# 15
# Diád alapú hullámforma.
# 40


== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? ==
457. sor: 523. sor:
# 250
# 250


== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? pl: +36-30-123-4567? ==
== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 1000
# 1000
464. sor: 530. sor:
# 250
# 250


== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
== Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# HMM alapú statisztikai parametrikus TTS.
# Igaz
# Diád alapú hullámforma összefűzéses TTS.
# Hamis
# LPC alapú TTS.
# Kempelen beszélő gépe.


== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# Jel-idő függvény alapon.
# Egó
# LPC alapú TTS-en.
# Lás
# Időtengely alapon.
# Sen
# Frekvencia-jel függvény alapon.
# átp
# Csók
# Rak


== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
== LPC analízisnél előállított maradékjelre mi jellemző? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 – 20 000 Hz
# Kinyerhetők belőle a formánsfrekvencia értékek.
# 30 – 3400 Hz
# Több biten kvantálható, mint az eredeti jel.
# 6000 – 10 000 Hz
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# 300 – 4000 Hz
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# 1000 – 7000 Hz
# Eldobható az eredeti jel enélkül is visszaállítható.
# Nagyobb az energiája az eredeti jelnél.


== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? ==
493. sor: 560. sor:
# 2
# 2


== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
== Mekkora amplitúdócsökkenés mérhető az ajkakról kisugárzott "á" hang esetén? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 180
# 6 dB/oktáv
# 200
# 12 db/oktáv
# 256
# 0 dB/oktáv
# 25
# -3 dB/oktáv
 
== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
# Hangszalagok
# Szájüreg
# Orrüreg
# Garat
# Tüdő
# Nyelv
 
== Mely hang(ok) zöngétlen(ek)? ==
{{kvízkérdés|típus=több|válasz=2,9|pontozás=-}}
# D
# Cs
# L
# Dz
# V
# G
# Zs
# Z
# K
 
== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
# Csak 6 bit alatti kvantálásnál létezik.
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# Függ a mintavételi frekvenciától.
# Csak logaritmikus kvantálásnál jelentkezik.
# Függ a kvantálási lépcsők számától.
# Lineáris kvantálásnál is létezik.


== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
== Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# F0, F1, F2, F3
# HMM statisztikai TTS.
# B1, B2, B3, F0, F1, F2, F3
# WaveNet TTS.
# zönge, zörej, F0, F1, F2, F3, hangerő
# Kempelen gépe.
# zönge, zörej, F1, F2, F3, F4, hangerő
# Diád alapú hullámforma.


== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
== Melyik hang(ok)nak van periodikus szakasza? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,2,7,8|pontozás=-}}
# F0, F1, F2, F3
# L
# B1, B2, B3, B4, B5
# M
# zönge, zörej, F0, F1, F2, F3, hangerő
# Sz
# zönge, zörej, F1, F2, F3, F4, hangerő
# F
# S
# H
# J
# Ny


== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
== Melyik hangnak a legmagasabb az F2 értéke? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Hogy a magánhangzók érthetőbbek legyenek.
# I
# Hogy ne legyen „huppogós” a beszéd.
# A
# Hogy a zárhangok érthetőbbek legyenek.
# U
# Hogy a réshangok érthetőbbek legyenek.
# E


== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? ==
== Melyik hangnak a legnagyobb az F1 értéke? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# C-k
# I
# V-k
# á
# Nazálisok
# ő
# Zárhangok
# U
# ú


== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? ==
535. sor: 637. sor:
# Az első 512 komponensét.
# Az első 512 komponensét.


== Egy akusztikus jellemzővektor… ==
== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# egy adott hosszúságú hangrészletet jellemez.
# 7000 Hz / 65 phon
# egy teljes bemondást jellemez.
# 1 kHz / 60 db
# egy teljes hangot jellemez.
# 1000 Hz/ 61 phon
# egy teljes szót jellemez.
# 20 Hz / 59 phon
# 500 Hz / 120 dB
# 18 kHz / 99 dB


== Mire jó a Gaussian Mixture Model (GMM)? ==
== Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Mindenre, amire a HMM is.
# Korpusz alapú elem összefűzős rendszer.
# Csak a HMM-mel kiegészítésben használható.
# Diád építőelemes beszédszintetizáló rendszer.
# Időillesztésre.
# Formás szintézis.
# Hasonlósági mérték számítására.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).


== A rejtett Markov modelleket (HMM)... ==
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# minden esetben helyettesíthetjük Markov láncokkal.
# Korpusz alapú elem összefűzős rendszer.
# a Viterbi-algoritmussal taníthatjuk be.
# Diád építőelemes beszédszintetizáló rendszer.
# a GMM-ekkel együtt lehet beszédfelismerésre használni.
# Formás szintézis.
# csak a GMM-mel kiegészítésben használhatjuk bármi is.
# Beszéddetektáló rendszer.


== A Viterbi-algoritmus… ==
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# a GMM paraméterek gyors közelítő számítására használható.
# Korpusz alapú elem összefűzős rendszer.
# a HMM paraméterek gyors közelítő számítására használható.
# Diád építőelemes beszédszintetizáló rendszer.
# adja meg a beszédfelismerésnél a helyes eredményt.
# Formás szintézis.
# a HMM legjobb illeszkedésű útvonalát mindig megtalálja.
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).


== Melyik állítás(ok) igaz(ak)? ==
== Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Beszédre csak lineáris kvantálást használunk.
# Korpusz alapú elem összefűzős rendszer.
# LPC-10 kódoló csak a zöngés részt kódolja.
# Diád építőelemes beszédszintetizáló rendszer.
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# Formás szintézis.
# A-törvényű (A-law) kvantálás lineáris.
# Beszéddetektáló rendszer.
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# Logaritmikus kvantálás veszteségmentesen visszaállítható.  


== Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? ==
== Melyik nem játszik közvetlen szerepet a hallásban? ==
{{kvízkérdés|típus=több|válasz=1,5|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Hangszalagok
# Eustach-kürt
# Szájüreg
# Kalapács
# Orrüreg
# Patkó
# Garat
# Dobhártya
# Tüdő
# Kasza
# Nyelv
# Üllő


== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? ==
== Melyik szinusz jelet halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# 7 triád
# 15 diád
# 19 diád
# 5 diád + 7 triád
# 10 diád + 10 triád
# 3 diád + 8 triád
 
== Melyik koszinusz jelnek a legkisebb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 7000 Hz / 65 phon
# 40 Hz-es 45 dB
# 1 kHz / 60 db
# 1 kHz-es 50 dB
# 1000 Hz/ 61 phon
# 2 kHz-es 49 dB
# 20 Hz / 59 phon
# 10 kHz-es 51 dB
# 500 Hz / 120 dB
# 18 kHz / 99 dB


== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
== Melyik szinusz jelnek a legnagyobb az intenzitása? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 375 ms
# 40 Hz-es 45 dB
# 280 ms
# 1 kHz-es 50 dB
# 350 ms
# 2 kHz-es 49 dB
# 325 ms
# 10 kHz-es 51 dB
# 200 ms
# 240 ms


== Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? ==
== Melyik szinusz jelnek legkisebb az intenzitása? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Magánhangzót látunk.
# 40 Hz-es 45 dB
# Zajt látunk.
# 1 kHz-es 50 dB
# Zöngétlen hangot látunk.
# 2 kHz-es 49 dB
# Zárhangot látunk.
# 10 kHz-es 51 dB
# Mássalhangzót látunk.
# Zöngés hangot látunk.


== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? ==
== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 1670 Hz
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# 600 Hz
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# 2980 Hz
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# 500 Hz
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# 550 Hz
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.
# 100 Hz


== Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? ==
== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
{{kvízkérdés|típus=több|válasz=3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
# -1
# Módosíthatja a hangidőtartamot.
# -2
# MFCC paramétereket számolunk vele.
# -6
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# -3
# Megszünteti a frekvenciaelfedés jelenséget.
# -4
# Módosítható vele a mintavételi frekvencia.
# -5
# Beszédfelismerésben használt.


== Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? ==
== Melyik állítás(ok) igaz(ak)? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# egó
# Beszédre csak lineáris kvantálást használunk.
# lás
# LPC-10 kódoló csak a zöngés részt kódolja.
# sen
# MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
# átp
# A-törvényű (A-law) kvantálás lineáris.
# csók
# A beszédkódolók minősége nem csak a bitsebességtől függ.
# rak
# Logaritmikus kvantálás veszteségmentesen visszaállítható.


== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! hangsorban, ha azt egy nő ejti ki? ==
== Melyiket halljuk a leghangosabbnak? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 200 ms
# 1kHz-en 40 dB
# 1 ms
# 2kHz-en 30 dB
# 100 μs
# 500 Hz-en 50 phon
# 4 ms
# 20 Hz-en 80 dB
# 40 ms
# 400 μs


== Melyiket használjuk az alábbiak közül betű-hang átalakításra? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# PAMPA
# SAMPA
# PUMPA
# SAMBA
# IPAK


== LPC analízisnél előállított maradékjelre mi jellemző? ==
== Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Kinyerhetők belőle a formánsfrekvencia értékek.
# 20 – 20 000 Hz
# Több biten kvantálható, mint az eredeti jel.
# 30 – 3400 Hz
# Az a jel a maradékjel, ami nem fért bele az analízisablakba.
# 6000 – 10 000 Hz
# LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
# 300 – 4000 Hz
# Eldobható az eredeti jel enélkül is visszaállítható.
# 1000 – 7000 Hz
# Nagyobb az energiája az eredeti jelnél.


== Mely hang(ok) zöngétlen(ek)? ==
== Mi NEM része a halló szervrendszerünknek? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# d
# Nyereg
# cs
# Kalapács
# l
# Kengyel
# dz
# üllő
# v
# g
 
== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# Normál beszéd 1m-ről.
# Sugárhajtású repülő hajtóműve 15m-ről.
# Suttogó beszéd 10m-ről.
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.


== Mi a Tacotron 2? ==
== Mi a Tacotron 2? ==
698. sor: 777. sor:
# Egy HMM alapú hullámforma generáló rendszer.
# Egy HMM alapú hullámforma generáló rendszer.
# End-to-end rendszer.
# End-to-end rendszer.
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
{{kvízkérdés|típus=több|válasz=1|pontozás=-}}
# kb. 135 Hz
# kb. 320 Hz
# kb. 65 Hz
# kb. 200 Hz
# kb. 220 Hz
# kb. 35 Hz
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# 1800 μs
# 45 s
# 30 s
# 900 ms
# 2000 ms
# 5800 μs
== Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
# 6 * 6 + 18 * 18
# 24 * 24 + 18 * 5 * 5
# 24 * 24 * 24
# 6 * 18 * 24
# 24 * 24
# 24 * 24 + 6 * 18 * 18
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
# 2400 Hz
# 200 kHz
# 12 Hz
# 120 Hz
# 25 Hz
# Nem tudjuk megállapítani.
== Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 26 * 26 * 26 + 10 * 10 * 10
# 36 * 36 + 26 * 10 * 10
# 36 * 36 + 10 * 26 * 26
# 36 * 36 * 36
# 36 * 36
# 10 * 10 + 26 * 26
== Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 7 * 19 * 26
# 19 * 19 * 19 + 7 * 7 * 7
# 26 * 26
# 26 * 26 + 7 * 19 * 19
# 26 * 26 + 26 * 26 * 26
# 26 * 26 * 26
== Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? ==
{{kvízkérdés|típus=több|válasz=3,5|pontozás=-}}
# Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
# Azonos életkorú beszélőkkel készítjük a felvételeket.
# Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
# Kevés jól megválasztott szó felolvasása is elegendő.
# Különböző korú és nemű emberrel is érdemes felvételt készíteni
# Csak studió körülmények között felvett beszédet lehet használni.
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 40
# 20
# 100
# 200
# 8
# 4
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 78 dBA
# 800 dBA
# 18 dBA
# 138 dBA
# 8 dBA
# -18 dBA


== Mi a WaveNet? ==
== Mi a WaveNet? ==
808. sor: 788. sor:
# Egy mély neurális háló alapú hullámforma generáló rendszer.
# Egy mély neurális háló alapú hullámforma generáló rendszer.


== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
== Mi a formáns definíciója? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 20 Hz - 30 Hz
# A hangszalagoknál kialakult zönge periódusideje.
# 20 kHz - 30 kHz
# A hangképző üreg által felerősített felhangnyaláb.
# 10 Hz - 20 Hz
# Az alapfrekvencia egész számú többszörösei.
# 15 kHz - 20 kHz
# A 2. és 3. Felharmonikus.
# 50 Hz - 5 kHz
 
# 5 kHz - 10 kHz
== Mi a hangnyomás mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# <math> \frac{W}{s^2} </math>
# <math> \frac{N}{m^2} </math>
# <math> \frac{Wm}{s^2} </math>
# <math> \frac{Jm}{s^2} </math>
 
== Mi a hangnyomásszinttel kifejezett decibelben szereplő szorzótényező? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# 20
# 10
# 15
# 50


== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
== Mi az akusztikai dB mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 Hz - 30 Hz
# W/m2
# 20 kHz - 30 kHz
# N/m2
# 10 Hz - 20 Hz
# M/s2
# 3 kHz - 10 kHz
# Mértékegység nélküli.
# 50 Hz - 5 kHz
 
# 5 kHz - 10 kHz
== Mi hangnyomás mértékegysége? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# W/m2
# N/m2
# M/s2
# Mértékegység nélküli.
 
== Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? ==
{{kvízkérdés|típus=több|válasz=1,6|pontozás=-}}
# A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
# A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
# Lineáris predikciós kódolás.
# Erős háttérzaj a beszéd felvétele közben.
# A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
# A bemeneti aluláteresztő szűrő hiánya.


== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? ==
== Mi igaz az F0, F1, F2 értékekre? ==
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
# F1 és F2 gyakorlatilag független F0-tól.
# Nagy energiájú hang lesz.
# F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
# Felpattanás a hang elejére kerül.  
# F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
# Több mint 100 ms hosszú a "p" hang.
# F0 a nulladik formáns, F1 az első, F2 pedig a második.
# A némafázisa nem hosszabb mint 100 μs.
# Fojtott zönge legalább 100 ms lesz.


== A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? ==
== Mi jellemző a "p" hangra? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
# Zöngés.
# Nagy energiájú hang lesz.
# Zárhang.
# Felpattanás a hang elejére kerül.  
# Felpattanás a hang elején található.
# Több mint 100 ms hosszú a "t" hang.
# F2 értéke magas.
# A némafázisa nem hosszabb mint 100 μs.
# Nazális.
# Fojtott zönge legalább 100 ms lesz.
# Fojtott zöngét tartalmaz.


== Mi jellemző a formánsokra? ==
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
{{kvízkérdés|típus=több|válasz=3,4,8,10|pontozás=-}}
# A néma fázisoknál is megmérhető.
# A néma fázisoknál is megmérhető.
# Értékük független a beszélő nemétől.
# Értékük független a beszélő nemétől.
852. sor: 856. sor:
# A magánhangzóknak 1440 db formánsa van.
# A magánhangzóknak 1440 db formánsa van.
# Vonalas spektrum esetén nem meghatározható.
# Vonalas spektrum esetén nem meghatározható.
== Mi jellemző a formánsokra? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
# Nem csak az F0 egész számú többszöröse lehet.
# Nem csak az F0 egész számú többszöröse lehet.
860. sor: 861. sor:
# A hang spektrumából meghatározható.
# A hang spektrumából meghatározható.
# Nem függ a beszédhangtól.
# Nem függ a beszédhangtól.
# Vonalas spektrum esetén nem meghatározható.


== Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? ==
== Mi jellemző a μ-law kódolásra? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 200 Hz
# A HMM beszédfelismerés előfeldolgozója.
# 25 Hz
# μ meredekségű lineáris kvantálás.
# 400 Hz
# Négyzetes kvantálású.
# 100 Hz
# 8 bites lineáris kvantálás.
# 125 Hz
# Nagy amplitúdó esetén ritkább a kvantálás.
# 250 Hz
# MFCC paraméterei.
 
== Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
# Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
# A zöngés hang zöngétlenedik.
# A zöngés hang felhangosodik.
 
== Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Más lesz a felharmonikusok menete a mondat közepén.
# Más az alapfrekvencia menete.
# Változatlan marad.
# Formánsok megváltoznak.


== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? ==
== Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? ==
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# kb. 140 Hz
# A 'p' zöngétlen hang, a 'b' zöngés.
# kb. 200 Hz
# Csak a ’p’-nek vannak zajkomponensei.
# kb. 70 Hz
# A ’b’ időben összetett szerkezetű, a ’p’ nem.
# kb. 220 Hz
# Csak a zajkomponensek frekvenciahelyei térnek el.
# kb. 320 Hz
 
# kb. 35 Hz
== Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? ==
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}}
# Szép, természetes hangzás.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
 
== Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? ==
{{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}}
# Szép, természetes hangzás.
# Biztosítja a hanszínezet megtartását új hanfelvételnél.
# Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
 
== Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# Jel-idő függvény alapon.
# LPC alapú TTS-en.
# Időtengely alapon.
# Frekvencia-jel függvény alapon.
 
== Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
 
== Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# HMM alapú statisztikai parametrikus TTS.
# Diád alapú hullámforma összefűzéses TTS.
# LPC alapú TTS.
# Kempelen beszélő gépe.
 
== Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 20 Hz - 30 Hz
# 20 kHz - 30 kHz
# 10 Hz - 20 Hz
# 3 kHz - 10 kHz
# 50 Hz - 5 kHz
# 5 kHz - 10 kHz
 
== Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 20 Hz - 30 Hz
# 20 kHz - 30 kHz
# 10 Hz - 20 Hz
# 15 kHz - 20 kHz
# 50 Hz - 5 kHz
# 5 kHz - 10 kHz
 
== Milyen hang NINCS a HASÁN szóban? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Nazális hang
# Réshang
# Magánhangzó
# összetett hang
# Zöngés hang


== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." ==
889. sor: 962. sor:
# 5800 ms
# 5800 ms


== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? ==
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." ==
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}}
{{kvízkérdés|típus=több|válasz=5|pontozás=-}}
# Módosíthatja a hangidőtartamot.
# 1800 μs
# MFCC paramétereket számolunk vele.
# 45 s
# Pitch Synchronous Overlap and Add-nek a rövidítése.
# 30 s
# Megszünteti a frekvenciaelfedés jelenséget.
# 900 ms
# Módosítható vele a mintavételi frekvencia.
# 2000 ms
# Beszédfelismerésben használt.
# 5800 μs
 
== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
# 4 hang
# 9 hang
# 3 hang
# 6 hang
# 5 hang
# 10 hang
 
== Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki? ==
{{kvízkérdés|típus=több|válasz=4|pontozás=-}}
# 200 ms
# 1 ms
# 100 μs
# 4 ms
# 40 ms
# 400 μs


== Mely hang(ok) zöngétlen(ek)? ==
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? ==
{{kvízkérdés|típus=több|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# g
# 78 dBA
# zs
# 800 dBA
# d
# 18 dBA
# dz
# 138 dBA
# z
# 8 dBA
# k
# -18 dBA


== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? ==
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# Benzinmotoros fűnyíró 1,5m-ről.
# 16 kHz
# Normál beszéd 1m-ről.
# 8 kHz
# Sugárhajtású repülő hajtóműve 15m-ről.
# 1 kHz
# Suttogó beszéd 10m-ről.
# 2 kHz
# Elhaladó vonat 2m-ről.
# Erős közúti forgalom 1m-ről.


== Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? ==
== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 10 000 bsp
# F0, F1, F2, F3
# 480 bps
# B1, B2, B3, F0, F1, F2, F3
# 4800 bps
# Zönge, zörej, F0, F1, F2, F3, hangerő
# 1000 bps
# Zönge, zörej, F1, F2, F3, F4, hangerő
# 48 bps
 
# 48 000 bps
== Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) ==
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# F0, F1, F2, F3
# B1, B2, B3, B4, B5
# Zönge, zörej, F0, F1, F2, F3, hangerő
# Zönge, zörej, F1, F2, F3, F4, hangerő


== Mi jellemző a μ-law kódolásra? ==
== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a "sósmogyoró" szó kiváló minőségű átviteléhez női bemondásnál? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# A HMM beszédfelismerés előfeldolgozója.
# 50 - 5000 Hz-es ideális szűrő, 22 Hz-es mintavételi frekvencia
# μ meredekségű lineáris kvantálás.
# 0 - 22 kHz-es ideális szűrő, 40 kHz-es mintavételi frekvencia
# Négyzetes kvantálású.
# 50 - 9000 Hz-es ideális szűrő, 22 kHz-es mintavételi frekvencia
# 8 bites lineáris kvantálás.
# 1 - 11 kHz-es ideális szűrő, 22 kHz-es mintavételi frekvencia
# Nagy amplitúdó esetén ritkább a kvantálás.
# MFCC paraméterei.


== Mi jellemző a "p" hangra? ==
== Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? ==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Zöngés.
# 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# Zárhang.
# 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Felpattanás a hang elején található.
# 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
# F2 értéke magas.
# 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
# Nazális.
# Fojtott zöngét tartalmaz.


== Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? ==
== Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? ==
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
# Folytonos
# A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
# Vonalas
# Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
# Elkent
# Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
# Felkent
# Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. az "alma" és a "körte" bemondások hasonlósága számítható.


== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? ==
== Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? ==
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# Érthetetlen lesz az átlapolódás miatt.
# 32
# Csak a mássalhangzók maradnak meg.
# 20
# Veszteségmentesen tárolható.
# 3
# Alig érhető marad a beszéd.
# 7
# Csak az alapfrekvencia marad meg.
# Majdnem tökéletesen megmarad a beszéd.


== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. ==
== Mire jó a Gaussian Mixture Model (GMM)? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 4 hang
# Mindenre, amire a HMM is.
# 9 hang
# Csak a HMM-mel kiegészítésben használható.
# 3 hang
# Időillesztésre.
# 6 hang
# Hasonlósági mérték számítására.
# 5 hang
# 10 hang


== Mely állítás(ok) igaz(ak) a kvantálási zajra? ==
== Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? ==
{{kvízkérdés|típus=több|válasz=5,6|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# Csak 6 bit alatti kvantálásnál létezik.
# Hogy a magánhangzók érthetőbbek legyenek.
# Értéke nem meghatározható, mert a használt mikrofontól függ.
# Hogy ne legyen „huppogós” a beszéd.
# Függ a mintavételi frekvenciától.
# Hogy a zárhangok érthetőbbek legyenek.
# Csak logaritmikus kvantálásnál jelentkezik.
# Hogy a réshangok érthetőbbek legyenek.
# Függ a kvantálási lépcsők számától.
# Lineáris kvantálásnál is létezik.


== Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) ==
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=egy|válasz=|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# 1000
# 40
# 5
# 20
# 13
# 100
# 200
# 200
# 16 000
# 8
# 80
# 4


== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)==
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}}
# MP3 kódolás.
# 40
# Egy réshang részletét látjuk.
# 20
# Fojtott zöngét látunk.
# 100
# A zaj kimaszkolta a jelet.
# 200
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
# 8
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
# 4


== Melyik hang(ok)nak van periodikus szakasza? ==
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? ==
{{kvízkérdés|típus=több|válasz=1,2|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}}
# l
# 40
# m
# 20
# sz
# 100
# f
# 200
# s
# 8
# h
# 4


== Melyik hang(ok)nak van periodikus szakasza? ==
== Női bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája a "Holnap este mozizunk." mondatban? ==
{{kvízkérdés|típus=több|válasz=2,4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# f
# 70 Hz
# j
# 100 Hz
# h
# 160 Hz
# ny
# 550 Hz
# s
# 2 kHz
# sz


== Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# 375 ms
# 4 kHz-en
# 280 ms
# 3,5 kHz-en
# 350 ms
# 7 kHz-en
# 325 ms
# 1 kHz-en
# 200 ms
# Sehol, mert kiszűrésre kerül.
# 240 ms
 
== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? ==
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}}
# 180
# 200
# 256
# 25


== Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? ==
== Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... ==
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}}
# 8 kHZ-en
# 9 kHz körüli beszédkomponens biztosan kiszűrthető.
# 4 kHz-en
# átlapolódást (aliasing) kivédtük.
# 3,5 kHz-en
# A hangminőség a telefonosnál biztosan jobb lesz.
# 7 kHz-en
# Többnyire érthető, de zajos lesz a jel.
# 1 kHz-en
# Biztosan érthetetlen, használhatatlan lesz a kimenet.
# Sehol, mert kiszűrésre kerül.
 
== Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)==
{{kvízkérdés|típus=több|válasz=2|pontozás=-}}
# Fojtott zöngét látunk.
# Egy réshang részletét látjuk.
# Túl kvantálási szint van.
# A zaj kimaszkolta a jelet.
# MP3 kódolás hibája.
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

A lap jelenlegi, 2023. november 16., 19:44-kori változata


ZH felkészítő
Statisztika
Átlagteljesítmény
-
Eddigi kérdések
0
Kapott pontok
0
Alapbeállított pontozás
(-)
-
Beállítások
Minden kérdés látszik
-
Véletlenszerű sorrend
-
-


10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású repülő hajtóműve 15m-ről.
  4. Suttogó beszéd 10m-ről.
  5. Elhaladó vonat 2m-ről.
  6. Erős közúti forgalom 1m-ről.

16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel?

Típus: egy. Válasz: 6. Pontozás: -.

  1. Érthetetlen lesz az átlapolódás miatt.
  2. Csak a mássalhangzók maradnak meg.
  3. Veszteségmentesen tárolható.
  4. Alig érhető marad a beszéd.
  5. Csak az alapfrekvencia marad meg.
  6. Majdnem tökéletesen megmarad a beszéd.

20 dB hangnyomászintet mértünk. Mi lehetett a forrás?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Sírás 1 m-ről
  2. Fűnyíró 2 m-ről
  3. Kiabálás 3 m-ről
  4. Suttogás 0,5 m-ről

3,1 kHz-es szinuszjelet anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-2300Hz sávszűrő van. Mi lesz a kimenő jel?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 1,9 kHz szinusz
  2. 3,1 kHz szinusz
  3. 1,7 kHz szinusz
  4. 1,9 és 2,9 kHz szinusz

60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: több. Válasz: 2. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5m-ről.
  2. Normál beszéd 1m-ről.
  3. Sugárhajtású gép hajtóműve 5 m-ről.
  4. Sugárhajtású repülő hajtóműve 15m-ről.
  5. Suttogó beszéd 10m-ről.
  6. Elhaladó vonat 2m-ről.
  7. Erős közúti forgalom 1m-ről.
  8. Haladó kamion 2 m-ről.
  9. Papírlap susogása 1 m-ről.

A "Kimegyünk?" mondat melyik hangjában a legnagyobb az alapfrekvencia?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Első k
  2. N
  3. E
  4. I
  5. Ü

A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. 7 triád
  2. 15 diád
  3. 20 diád
  4. 6 diád + 7 triád
  5. 10 diád + 10 triád
  6. 3 diád + 8 triád

A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 1,4. Pontozás: -.

  1. A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "p" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 4. Pontozás: -.

  1. A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú a "t" hang.
  5. A némafázisa nem hosszabb mint 100 μs.
  6. Fojtott zönge legalább 100 ms lesz.

A Viterbi-algoritmus…

Típus: egy. Válasz: 4. Pontozás: -.

  1. A GMM paraméterek gyors közelítő számítására használható.
  2. A HMM paraméterek gyors közelítő számítására használható.
  3. Adja meg a beszédfelismerésnél a helyes eredményt.
  4. A HMM legjobb illeszkedésű útvonalát mindig megtalálja.

A felharmonikusok definíció szerint…

Típus: egy. Válasz: 2. Pontozás: -.

  1. Megegyeznek a formánsok középfrekvenciáival.
  2. Az alapfrekvencia egész számú többszörösei.
  3. A rezonátorüreg által felerősített felhangnyalábok.
  4. Az alapfrekvencia páratlan, egészszámú többszörösei.

A felharmonikusok és az alapfrekvencia között milyen összefüggés van?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az alapfrekvenciát a felharmonikusokkal maradék nélkül tudjuk osztani.
  2. A felharmonikusok az alapfrekvencia egész számú többszörösei.
  3. A felharmonikusok az alapfrekvenciának mindig a kétszerese.
  4. Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.

A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Forrás-szűrő.
  2. Jel-szűrő.
  3. Frekvencia-szűrő.
  4. Intenzitás-szűrő.

A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél?

Típus: egy. Válasz: 2. Pontozás: -.

  1. C-k
  2. V-k
  3. Nazálisok
  4. Zárhangok

A kvantálás(t)...

Típus: egy. Válasz: 2. Pontozás: -.

  1. Lépésköze függ a mintavételi frekvenciától.
  2. Lépésköze nem függ a mintavételi frekvenciától.
  3. Veszteségmentesen visszaállítható.
  4. Lépésköze nem befolyásolja a hangminőséget.
  5. Csak egyenletes közökkel használják beszédre.
  6. Függ a beszéd alapfrekvenciájától.

A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?

Típus: több. Válasz: 1,7. Pontozás: -.

  1. Kb. 135 Hz
  2. Kb. 320 Hz
  3. Kb. 65 Hz
  4. Kb. 200 Hz
  5. Kb. 220 Hz
  6. Kb. 35 Hz
  7. Kb. 140 Hz
  8. Kb. 70 Hz

A rejtett Markov modelleket (HMM)...

Típus: egy. Válasz: 3. Pontozás: -.

  1. Minden esetben helyettesíthetjük Markov láncokkal.
  2. A Viterbi-algoritmussal taníthatjuk be.
  3. A GMM-ekkel együtt lehet beszédfelismerésre használni.
  4. Csak a GMM-mel kiegészítésben használhatjuk bármi is.

A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta:

Típus: egy. Válasz: 3. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang:

Típus: egy. Válasz: 4. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang:

Típus: egy. Válasz: 1. Pontozás: -.

  1. T < 50 ms
  2. T = 50 ms
  3. 50 < t < 100 ms
  4. 100 ms < t

A “hasát” szóban milyen hang található?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Réshang
  4. Zöngés zárhang

A “sás” szót kiejtve milyen rész található a beszédjelben?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Pergő rész
  2. Nazális
  3. Zöngés rész
  4. Zöngés zárhang

A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia?

Típus: egy. Válasz: 1. Pontozás: -.

  1. á
  2. Záró „k”
  3. U
  4. A

A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. A b felpattanás elé szünetet kell beiktatni.
  2. A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
  3. A b előtti zár szakaszt csendre kell cserélni.
  4. Nem megvalósítható.

Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz!

Típus: több. Válasz: 1,2,4. Pontozás: -.

  1. Szöveg gyűjtése.
  2. Hang felvétele mester mondattal.
  3. Szótagokra vágás.
  4. Fonetikai átirat és hanghatár bejelölése minden mondatra.

Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Annotálás és szegmentálás.
  2. Szupraszegmentálás és koartikuláció.
  3. Koartikuláció és annotálás.
  4. Egyik sem.

Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Sz
  2. K
  3. T
  4. D
  5. A

Az alábbiak közül melyik segít a beszédhangok határainak jelölésében?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Spektogram.
  2. Intenzitás-idő függvény.
  3. Felvétel meghallgatása.
  4. Mindegyik segít benne.

Az annotálás...

Típus: egy. Válasz: 2. Pontozás: -.

  1. A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
  2. A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
  3. A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
  4. A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 10 000 bsp
  2. 480 bps
  3. 4800 bps
  4. 1000 bps
  5. 48 bps
  6. 48 000 bps

Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?

Típus: több. Válasz: 3,6. Pontozás: -.

  1. 1670 Hz
  2. 600 Hz
  3. 2980 Hz
  4. 500 Hz
  5. 550 Hz
  6. 100 Hz

Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 0,5 kHz-es szinuszjel.
  2. 2 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1 kHz-es szinuszjel.

Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 3,1 kHz-es szinuszjel.
  2. 1,7 kHz-es szinuszjel.
  3. 3 kHz-es szinuszjel.
  4. 1,7 és 3,1 kHz-es szinuszjel.

Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 120 dB
  2. 63 dB
  3. 60 dB
  4. 90 dB

Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 8 kHZ-en
  2. 4 kHz-en
  3. 3,5 kHz-en
  4. 7 kHz-en
  5. 1 kHz-en
  6. Sehol, mert kiszűrésre kerül.

Egy akusztikus jellemzővektor…

Típus: egy. Válasz: 1. Pontozás: -.

  1. Egy adott hosszúságú hangrészletet jellemez.
  2. Egy teljes bemondást jellemez.
  3. Egy teljes hangot jellemez.
  4. Egy teljes szót jellemez.

Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 6 dB
  2. -6 dB
  3. 3 dB
  4. -3 dB

Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?

Típus: több. Válasz: 6. Pontozás: -.

  1. Magánhangzót látunk.
  2. Zajt látunk.
  3. Zöngétlen hangot látunk.
  4. Zárhangot látunk.
  5. Mássalhangzót látunk.
  6. Zöngés hangot látunk.

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2. Pontozás: -.

  1. Fojtott zöngét látunk.
  2. Egy réshang részletét látjuk.
  3. Túl kvantálási szint van.
  4. A zaj kimaszkolta a jelet.
  5. MP3 kódolás hibája.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)

Típus: több. Válasz: 2, 5. Pontozás: -.

  1. MP3 kódolás.
  2. Egy réshang részletét látjuk.
  3. Fojtott zöngét látunk.
  4. A zaj kimaszkolta a jelet.
  5. Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
  6. Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.

Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Profi bemondó, változatos hanganyag.
  2. Több beszélő, szavak felolvasása.
  3. Egy bemondó, egy hang kitartása.
  4. Egyik sem.

Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása?

Típus: több. Válasz: 3. Pontozás: -.

  1. -1
  2. -2
  3. -6
  4. -3
  5. -4
  6. -5

Egy másodperces beszéd mennyi helyet foglal 22kHz mintavételezés és 16 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 44 bájt
  2. 22 kbájt
  3. 44 kbájt
  4. 88 kbájt

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 176 kByte
  4. 88 kByte

Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 88 Byte
  2. 44 kByte
  3. 88 kByte
  4. 132 kByte

Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 6. Pontozás: -.

  1. 6 * 6 + 18 * 18
  2. 24 * 24 + 18 * 5 * 5
  3. 24 * 24 * 24
  4. 6 * 18 * 24
  5. 24 * 24
  6. 24 * 24 + 6 * 18 * 18

Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 7 * 19 * 26
  2. 19 * 19 * 19 + 7 * 7 * 7
  3. 26 * 26
  4. 26 * 26 + 7 * 19 * 19
  5. 26 * 26 + 26 * 26 * 26
  6. 26 * 26 * 26

Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 26 * 26 * 26 + 10 * 10 * 10
  2. 36 * 36 + 26 * 10 * 10
  3. 36 * 36 + 10 * 26 * 26
  4. 36 * 36 * 36
  5. 36 * 36
  6. 10 * 10 + 26 * 26

Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?

Típus: több. Válasz: 6. Pontozás: -.

  1. 2400 Hz
  2. 200 kHz
  3. 12 Hz
  4. 120 Hz
  5. 25 Hz
  6. Nem tudjuk megállapítani.

Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. 200 Hz
  2. 25 Hz
  3. 400 Hz
  4. 100 Hz
  5. 125 Hz
  6. 250 Hz

Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában?

Típus: egy. Válasz: 6. Pontozás: -.

  1. 1000
  2. 5
  3. 13
  4. 200
  5. 16 000
  6. 80

Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
  2. Azonos életkorú beszélőkkel készítjük a felvételeket.
  3. Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
  4. Kevés jól megválasztott szó felolvasása is elegendő.
  5. Különböző korú és nemű emberrel is érdemes felvételt készíteni
  6. Csak studió körülmények között felvett beszédet lehet használni.

Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.”

Típus: egy. Válasz: 4. Pontozás: -.

  1. 10 Hz
  2. 100 Hz
  3. 20 Hz
  4. 70 Hz

Hogy hívják az egyenlő hangosság érzetű görbét?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Phon
  2. Phön
  3. Schön
  4. Decibel

Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Személyfüggő kapcsolat van.
  2. Függetlenek tőle.
  3. Az alapfrekvencia egészszámú többszöröseinél vannak.
  4. Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.

Hogyan lehet a kasza szóból kata szót készíteni hangsebészettel?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Sehogy
  2. Az sz hang első 90%-át csendre kell cserélni
  3. Az sz hang első felének amplitúdóját nullára kell állítani
  4. Az sz hang helyére fojtott zöngét kell egy másik bemondásból beállítani
  5. Az sz hangot ki kell vágni

Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Zönge
  2. Zengő
  3. Vokál
  4. Spektrál
  5. Surlódási zörej

Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Felharmonikus
  2. Alapfrekvencia
  3. Formáns
  4. Oktáv

Hogyan változik meg egy felpattanó zárhang nyújtáskor?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Az energiája megnő.
  2. Megismétlődik a felpattanó rész.
  3. Zárrész megnyúlik.
  4. Megnő az alapfrekvenciája.

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 8 bites
  2. 12 bites
  3. 4 bites
  4. 16 bites

Hány bites a lineáris kvantáló, ha a maximális kivezérlésű jel és a kvantálási zaj viszonya 96 dB?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 4 bites
  2. 8 bites
  3. 16 bites
  4. 32 bites

Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?

Típus: több. Válasz: 1,7. Pontozás: -.

  1. 1600
  2. 10 000
  3. 256
  4. 64
  5. 39 * 39 * 39
  6. 25 + 14
  7. 39 * 39
  8. 25 * 25 * 14 + 25 * 25

Hány felharmonikus mérhető 4000 Hz-ig 200 Hz alapfrekvencia mellett?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 19
  2. 20
  3. 15
  4. 40

Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 1000
  2. 9
  3. 25
  4. 250

Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.

Típus: egy. Válasz: 1. Pontozás: -.

  1. Igaz
  2. Hamis

Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge?

Típus: több. Válasz: 1. Pontozás: -.

  1. Egó
  2. Lás
  3. Sen
  4. átp
  5. Csók
  6. Rak

LPC analízisnél előállított maradékjelre mi jellemző?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Kinyerhetők belőle a formánsfrekvencia értékek.
  2. Több biten kvantálható, mint az eredeti jel.
  3. Az a jel a maradékjel, ami nem fért bele az analízisablakba.
  4. LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
  5. Eldobható az eredeti jel enélkül is visszaállítható.
  6. Nagyobb az energiája az eredeti jelnél.

Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 168
  2. 10
  3. 40
  4. 2

Mekkora amplitúdócsökkenés mérhető az ajkakról kisugárzott "á" hang esetén?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 6 dB/oktáv
  2. 12 db/oktáv
  3. 0 dB/oktáv
  4. -3 dB/oktáv

Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?

Típus: több. Válasz: 1,5. Pontozás: -.

  1. Hangszalagok
  2. Szájüreg
  3. Orrüreg
  4. Garat
  5. Tüdő
  6. Nyelv

Mely hang(ok) zöngétlen(ek)?

Típus: több. Válasz: 2,9. Pontozás: -.

  1. D
  2. Cs
  3. L
  4. Dz
  5. V
  6. G
  7. Zs
  8. Z
  9. K

Mely állítás(ok) igaz(ak) a kvantálási zajra?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. Csak 6 bit alatti kvantálásnál létezik.
  2. Értéke nem meghatározható, mert a használt mikrofontól függ.
  3. Függ a mintavételi frekvenciától.
  4. Csak logaritmikus kvantálásnál jelentkezik.
  5. Függ a kvantálási lépcsők számától.
  6. Lineáris kvantálásnál is létezik.

Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához?

Típus: egy. Válasz: 1. Pontozás: -.

  1. HMM statisztikai TTS.
  2. WaveNet TTS.
  3. Kempelen gépe.
  4. Diád alapú hullámforma.

Melyik hang(ok)nak van periodikus szakasza?

Típus: több. Válasz: 1,2,7,8. Pontozás: -.

  1. L
  2. M
  3. Sz
  4. F
  5. S
  6. H
  7. J
  8. Ny

Melyik hangnak a legmagasabb az F2 értéke?

Típus: egy. Válasz: 1. Pontozás: -.

  1. I
  2. A
  3. U
  4. E

Melyik hangnak a legnagyobb az F1 értéke?

Típus: egy. Válasz: 2. Pontozás: -.

  1. I
  2. á
  3. ő
  4. U
  5. ú

Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Az első 226 komponensét.
  2. Az első 128 komponensét.
  3. Az első 256 komponensét.
  4. Az első 512 komponensét.

Melyik koszinusz jelnek a legkisebb az intenzitása?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 7000 Hz / 65 phon
  2. 1 kHz / 60 db
  3. 1000 Hz/ 61 phon
  4. 20 Hz / 59 phon
  5. 500 Hz / 120 dB
  6. 18 kHz / 99 dB

Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).

Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Korpusz alapú elem összefűzős rendszer.
  2. Diád építőelemes beszédszintetizáló rendszer.
  3. Formás szintézis.
  4. Beszéddetektáló rendszer.

Melyik nem játszik közvetlen szerepet a hallásban?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Eustach-kürt
  2. Kalapács
  3. Patkó
  4. Dobhártya
  5. Kasza
  6. Üllő

Melyik szinusz jelet halljuk a leghangosabbnak?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelnek a legnagyobb az intenzitása?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik szinusz jelnek legkisebb az intenzitása?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 40 Hz-es 45 dB
  2. 1 kHz-es 50 dB
  3. 2 kHz-es 49 dB
  4. 10 kHz-es 51 dB

Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?

Típus: egy. Válasz: 5. Pontozás: -.

  1. Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
  2. A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
  3. Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
  4. Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
  5. Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.

Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?

Típus: több. Válasz: 1,3. Pontozás: -.

  1. Módosíthatja a hangidőtartamot.
  2. MFCC paramétereket számolunk vele.
  3. Pitch Synchronous Overlap and Add-nek a rövidítése.
  4. Megszünteti a frekvenciaelfedés jelenséget.
  5. Módosítható vele a mintavételi frekvencia.
  6. Beszédfelismerésben használt.

Melyik állítás(ok) igaz(ak)?

Típus: több. Válasz: 5. Pontozás: -.

  1. Beszédre csak lineáris kvantálást használunk.
  2. LPC-10 kódoló csak a zöngés részt kódolja.
  3. MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
  4. A-törvényű (A-law) kvantálás lineáris.
  5. A beszédkódolók minősége nem csak a bitsebességtől függ.
  6. Logaritmikus kvantálás veszteségmentesen visszaállítható.

Melyiket halljuk a leghangosabbnak?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 1kHz-en 40 dB
  2. 2kHz-en 30 dB
  3. 500 Hz-en 50 phon
  4. 20 Hz-en 80 dB

Melyiket használjuk az alábbiak közül betű-hang átalakításra?

Típus: egy. Válasz: 2. Pontozás: -.

  1. PAMPA
  2. SAMPA
  3. PUMPA
  4. SAMBA
  5. IPAK

Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 – 20 000 Hz
  2. 30 – 3400 Hz
  3. 6000 – 10 000 Hz
  4. 300 – 4000 Hz
  5. 1000 – 7000 Hz

Mi NEM része a halló szervrendszerünknek?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Nyereg
  2. Kalapács
  3. Kengyel
  4. üllő

Mi a Tacotron 2?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy beszédfelismerő eszköz.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

Mi a WaveGlow?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Egy beszédátvitelt szabványosító szervezet.
  2. Egy mély neurálisháló alapú rendszer.
  3. Beszédalapú helymeghatározási megoldás.
  4. Egy folyamat alapú beszédgeneráló rendszer.
  5. Egy HMM alapú hullámforma generáló rendszer.
  6. End-to-end rendszer.

Mi a WaveNet?

Típus: több. Válasz: 3,5,7. Pontozás: -.

  1. Ultrahangos beszédrögzítő készülék.
  2. Egy beszédátvitelt szabványosító szervezet.
  3. Egy hullámforma generáló rendszer, amely gépi tanuláson alapul.
  4. Beszéd alapú helymeghatározási megoldás.
  5. Egy DNN alapú hullámforma generáló rendszer.
  6. Egy HMM alapú hullámforma generáló rendszer.
  7. Egy mély neurális háló alapú hullámforma generáló rendszer.

Mi a formáns definíciója?

Típus: egy. Válasz: 2. Pontozás: -.

  1. A hangszalagoknál kialakult zönge periódusideje.
  2. A hangképző üreg által felerősített felhangnyaláb.
  3. Az alapfrekvencia egész számú többszörösei.
  4. A 2. és 3. Felharmonikus.

Mi a hangnyomás mértékegysége?

Típus: egy. Válasz: 2. Pontozás: -.

Mi a hangnyomásszinttel kifejezett decibelben szereplő szorzótényező?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 20
  2. 10
  3. 15
  4. 50

Mi az akusztikai dB mértékegysége?

Típus: egy. Válasz: 4. Pontozás: -.

  1. W/m2
  2. N/m2
  3. M/s2
  4. Mértékegység nélküli.

Mi hangnyomás mértékegysége?

Típus: egy. Válasz: 2. Pontozás: -.

  1. W/m2
  2. N/m2
  3. M/s2
  4. Mértékegység nélküli.

Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?

Típus: több. Válasz: 1,6. Pontozás: -.

  1. A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
  2. A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
  3. Lineáris predikciós kódolás.
  4. Erős háttérzaj a beszéd felvétele közben.
  5. A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
  6. A bemeneti aluláteresztő szűrő hiánya.

Mi igaz az F0, F1, F2 értékekre?

Típus: egy. Válasz: 1. Pontozás: -.

  1. F1 és F2 gyakorlatilag független F0-tól.
  2. F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
  3. F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
  4. F0 a nulladik formáns, F1 az első, F2 pedig a második.

Mi jellemző a "p" hangra?

Típus: több. Válasz: 2. Pontozás: -.

  1. Zöngés.
  2. Zárhang.
  3. Felpattanás a hang elején található.
  4. F2 értéke magas.
  5. Nazális.
  6. Fojtott zöngét tartalmaz.

Mi jellemző a formánsokra?

Típus: több. Válasz: 3,4,8,10. Pontozás: -.

  1. A néma fázisoknál is megmérhető.
  2. Értékük független a beszélő nemétől.
  3. Az F2 meghatározza a magánhangzó hangrendjét.
  4. Az alapfrekvenciánál nagyobb az értékük.
  5. A magánhangzóknak 1440 db formánsa van.
  6. Vonalas spektrum esetén nem meghatározható.
  7. Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
  8. Nem csak az F0 egész számú többszöröse lehet.
  9. A magánhangzók 1140 db formánsa van.
  10. A hang spektrumából meghatározható.
  11. Nem függ a beszédhangtól.

Mi jellemző a μ-law kódolásra?

Típus: egy. Válasz: 5. Pontozás: -.

  1. A HMM beszédfelismerés előfeldolgozója.
  2. μ meredekségű lineáris kvantálás.
  3. Négyzetes kvantálású.
  4. 8 bites lineáris kvantálás.
  5. Nagy amplitúdó esetén ritkább a kvantálás.
  6. MFCC paraméterei.

Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal?

Típus: egy. Válasz: 1. Pontozás: -.

  1. Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
  2. Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
  3. A zöngés hang zöngétlenedik.
  4. A zöngés hang felhangosodik.

Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Más lesz a felharmonikusok menete a mondat közepén.
  2. Más az alapfrekvencia menete.
  3. Változatlan marad.
  4. Formánsok megváltoznak.

Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől?

Típus: egy. Válasz: 1. Pontozás: -.

  1. A 'p' zöngétlen hang, a 'b' zöngés.
  2. Csak a ’p’-nek vannak zajkomponensei.
  3. A ’b’ időben összetett szerkezetű, a ’p’ nem.
  4. Csak a zajkomponensek frekvenciahelyei térnek el.

Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre?

Típus: több. Válasz: 1,2,3. Pontozás: -.

  1. Szép, természetes hangzás.
  2. Biztosítja a hanszínezet megtartását új hanfelvételnél.
  3. Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
  4. Minden hangkapcsolódást jó akusztikai formában elő tud állítani.

Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál?

Típus: egy. Válasz: 3. Pontozás: -.

  1. Jel-idő függvény alapon.
  2. LPC alapú TTS-en.
  3. Időtengely alapon.
  4. Frekvencia-jel függvény alapon.

Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  2. 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
  4. 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.

Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás?

Típus: egy. Válasz: 2. Pontozás: -.

  1. HMM alapú statisztikai parametrikus TTS.
  2. Diád alapú hullámforma összefűzéses TTS.
  3. LPC alapú TTS.
  4. Kempelen beszélő gépe.

Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz - 30 kHz
  3. 10 Hz - 20 Hz
  4. 3 kHz - 10 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma?

Típus: egy. Válasz: 5. Pontozás: -.

  1. 20 Hz - 30 Hz
  2. 20 kHz - 30 kHz
  3. 10 Hz - 20 Hz
  4. 15 kHz - 20 kHz
  5. 50 Hz - 5 kHz
  6. 5 kHz - 10 kHz

Milyen hang NINCS a HASÁN szóban?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Nazális hang
  2. Réshang
  3. Magánhangzó
  4. összetett hang
  5. Zöngés hang

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni."

Típus: egy. Válasz: 6. Pontozás: -.

  1. 5900 μs
  2. 900 ms
  3. 2500 μs
  4. 30 s
  5. 45 s
  6. 5800 ms

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség."

Típus: több. Válasz: 5. Pontozás: -.

  1. 1800 μs
  2. 45 s
  3. 30 s
  4. 900 ms
  5. 2000 ms
  6. 5800 μs

Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk.

Típus: egy. Válasz: 5. Pontozás: -.

  1. 4 hang
  2. 9 hang
  3. 3 hang
  4. 6 hang
  5. 5 hang
  6. 10 hang

Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki?

Típus: több. Válasz: 4. Pontozás: -.

  1. 200 ms
  2. 1 ms
  3. 100 μs
  4. 4 ms
  5. 40 ms
  6. 400 μs

Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 78 dBA
  2. 800 dBA
  3. 18 dBA
  4. 138 dBA
  5. 8 dBA
  6. -18 dBA

Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 16 kHz
  2. 8 kHz
  3. 1 kHz
  4. 2 kHz

Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 3. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, F0, F1, F2, F3
  3. Zönge, zörej, F0, F1, F2, F3, hangerő
  4. Zönge, zörej, F1, F2, F3, F4, hangerő

Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság)

Típus: egy. Válasz: 2. Pontozás: -.

  1. F0, F1, F2, F3
  2. B1, B2, B3, B4, B5
  3. Zönge, zörej, F0, F1, F2, F3, hangerő
  4. Zönge, zörej, F1, F2, F3, F4, hangerő

Milyen sáváteresztő szűrő és mintavételi frekvencia kell a "sósmogyoró" szó kiváló minőségű átviteléhez női bemondásnál?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 50 - 5000 Hz-es ideális szűrő, 22 Hz-es mintavételi frekvencia
  2. 0 - 22 kHz-es ideális szűrő, 40 kHz-es mintavételi frekvencia
  3. 50 - 9000 Hz-es ideális szűrő, 22 kHz-es mintavételi frekvencia
  4. 1 - 11 kHz-es ideális szűrő, 22 kHz-es mintavételi frekvencia

Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  2. 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
  3. 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
  4. 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.

Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Folytonos
  2. Vonalas
  3. Elkent
  4. Felkent

Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 32
  2. 20
  3. 3
  4. 7

Mire jó a Gaussian Mixture Model (GMM)?

Típus: egy. Válasz: 4. Pontozás: -.

  1. Mindenre, amire a HMM is.
  2. Csak a HMM-mel kiegészítésben használható.
  3. Időillesztésre.
  4. Hasonlósági mérték számítására.

Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva?

Típus: egy. Válasz: 2. Pontozás: -.

  1. Hogy a magánhangzók érthetőbbek legyenek.
  2. Hogy ne legyen „huppogós” a beszéd.
  3. Hogy a zárhangok érthetőbbek legyenek.
  4. Hogy a réshangok érthetőbbek legyenek.

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 1. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: egy. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Női bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája a "Holnap este mozizunk." mondatban?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 70 Hz
  2. 100 Hz
  3. 160 Hz
  4. 550 Hz
  5. 2 kHz

PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?

Típus: egy. Válasz: 4. Pontozás: -.

  1. 375 ms
  2. 280 ms
  3. 350 ms
  4. 325 ms
  5. 200 ms
  6. 240 ms

Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni?

Típus: egy. Válasz: 3. Pontozás: -.

  1. 180
  2. 200
  3. 256
  4. 25

Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva...

Típus: egy. Válasz: 4. Pontozás: -.

  1. 9 kHz körüli beszédkomponens biztosan kiszűrthető.
  2. átlapolódást (aliasing) kivédtük.
  3. A hangminőség a telefonosnál biztosan jobb lesz.
  4. Többnyire érthető, de zajos lesz a jel.
  5. Biztosan érthetetlen, használhatatlan lesz a kimenet.