„ZH felkészítést segítő kvíz” változatai közötti eltérés
A VIK Wikiből
aNincs szerkesztési összefoglaló |
deduped |
||
1. sor: | 1. sor: | ||
{{Vissza|Beszéd-információs_rendszerek}} | {{Vissza|Beszéd-információs_rendszerek}} | ||
{{kvízoldal|cím=ZH felkészítő|pontozás=-}} | |||
== 10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? == | |||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | |||
# Benzinmotoros fűnyíró 1,5m-ről. | |||
# Normál beszéd 1m-ről. | |||
# Sugárhajtású repülő hajtóműve 15m-ről. | |||
# Suttogó beszéd 10m-ről. | |||
# Elhaladó vonat 2m-ről. | |||
# Erős közúti forgalom 1m-ről. | |||
== 16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel? == | |||
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}} | |||
# Érthetetlen lesz az átlapolódás miatt. | |||
# Csak a mássalhangzók maradnak meg. | |||
# Veszteségmentesen tárolható. | |||
# Alig érhető marad a beszéd. | |||
# Csak az alapfrekvencia marad meg. | |||
# Majdnem tökéletesen megmarad a beszéd. | |||
== 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? == | |||
{{kvízkérdés|típus=több|válasz=2|pontozás=-}} | |||
# Benzinmotoros fűnyíró 1,5m-ről. | |||
# Normál beszéd 1m-ről. | |||
# Sugárhajtású repülő hajtóműve 15m-ről. | |||
# Suttogó beszéd 10m-ről. | |||
# Elhaladó vonat 2m-ről. | |||
# Erős közúti forgalom 1m-ről. | |||
== A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg? == | |||
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}} | |||
# 7 triád | |||
# 15 diád | |||
# 19 diád | |||
# 5 diád + 7 triád | |||
# 10 diád + 10 triád | |||
# 3 diád + 8 triád | |||
== A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek? == | |||
{{kvízkérdés|típus=több|válasz=1,4|pontozás=-}} | |||
# A "p" hang megváltozik a szó közepén a rövid verzióhoz képest. | |||
# Nagy energiájú hang lesz. | |||
# Felpattanás a hang elejére kerül. | |||
# Több mint 100 ms hosszú a "p" hang. | |||
# A némafázisa nem hosszabb mint 100 μs. | |||
# Fojtott zönge legalább 100 ms lesz. | |||
{{ | == A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek? == | ||
| | {{kvízkérdés|típus=több|válasz=4|pontozás=-}} | ||
|pontozás=-}} | # A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest. | ||
# Nagy energiájú hang lesz. | |||
# Felpattanás a hang elejére kerül. | |||
# Több mint 100 ms hosszú a "t" hang. | |||
# A némafázisa nem hosszabb mint 100 μs. | |||
# Fojtott zönge legalább 100 ms lesz. | |||
== A Viterbi-algoritmus… == | |||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | |||
# A GMM paraméterek gyors közelítő számítására használható. | |||
# A HMM paraméterek gyors közelítő számítására használható. | |||
# Adja meg a beszédfelismerésnél a helyes eredményt. | |||
# A HMM legjobb illeszkedésű útvonalát mindig megtalálja. | |||
== A felharmonikusok definíció szerint… == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# Megegyeznek a formánsok középfrekvenciáival. | |||
# Az alapfrekvencia egész számú többszörösei. | |||
# A rezonátorüreg által felerősített felhangnyalábok. | |||
# Az alapfrekvencia páratlan, egészszámú többszörösei. | |||
== A felharmonikusok és az alapfrekvencia között milyen összefüggés van? == | == A felharmonikusok és az alapfrekvencia között milyen összefüggés van? == | ||
15. sor: | 77. sor: | ||
# Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust. | # Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust. | ||
== A | == A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni? == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# t | # Forrás-szűrő. | ||
# | # Jel-szűrő. | ||
# | # Frekvencia-szűrő. | ||
# | # Intenzitás-szűrő. | ||
== A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél? == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# C-k | |||
# V-k | |||
# Nazálisok | |||
# Zárhangok | |||
== A kvantálás(t)... == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# Lépésköze függ a mintavételi frekvenciától. | |||
# Lépésköze nem függ a mintavételi frekvenciától. | |||
# Veszteségmentesen visszaállítható. | |||
# Lépésköze nem befolyásolja a hangminőséget. | |||
# Csak egyenletes közökkel használják beszédre. | |||
# Függ a beszéd alapfrekvenciájától. | |||
== A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő? == | |||
{{kvízkérdés|típus=több|válasz=1,7|pontozás=-}} | |||
# Kb. 135 Hz | |||
# Kb. 320 Hz | |||
# Kb. 65 Hz | |||
# Kb. 200 Hz | |||
# Kb. 220 Hz | |||
# Kb. 35 Hz | |||
# Kb. 140 Hz | |||
# Kb. 70 Hz | |||
== A rejtett Markov modelleket (HMM)... == | |||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | |||
# Minden esetben helyettesíthetjük Markov láncokkal. | |||
# A Viterbi-algoritmussal taníthatjuk be. | |||
# A GMM-ekkel együtt lehet beszédfelismerésre használni. | |||
# Csak a GMM-mel kiegészítésben használhatjuk bármi is. | |||
== A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: == | == A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta: == | ||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # T < 50 ms | ||
# | # T = 50 ms | ||
# 50 < t < 100 ms | # 50 < t < 100 ms | ||
# 100 ms < t | # 100 ms < t | ||
31. sor: | 127. sor: | ||
== A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: == | == A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang: == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # T < 50 ms | ||
# | # T = 50 ms | ||
# 50 < t < 100 ms | # 50 < t < 100 ms | ||
# 100 ms < t | # 100 ms < t | ||
== | == A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang: == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # T < 50 ms | ||
# | # T = 50 ms | ||
# 50 < t < 100 ms | |||
# 100 ms < t | |||
== | == A “hasát” szóban milyen hang található? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # Pergő rész | ||
# | # Nazális | ||
# | # Réshang | ||
# | # Zöngés zárhang | ||
== A “sás” szót kiejtve milyen rész található a beszédjelben? == | |||
== A | |||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # Pergő rész | ||
# | # Nazális | ||
# | # Zöngés rész | ||
# | # Zöngés zárhang | ||
== | == A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia? == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # á | ||
# | # Záró „k” | ||
# | # U | ||
# | # A | ||
== | == A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # A b felpattanás elé szünetet kell beiktatni. | ||
# | # A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján. | ||
# A b előtti zár szakaszt csendre kell cserélni. | |||
# Nem megvalósítható. | |||
# | |||
# | |||
== Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! == | == Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz! == | ||
114. sor: | 174. sor: | ||
# Fonetikai átirat és hanghatár bejelölése minden mondatra. | # Fonetikai átirat és hanghatár bejelölése minden mondatra. | ||
== | == Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Annotálás és szegmentálás. | ||
# | # Szupraszegmentálás és koartikuláció. | ||
# | # Koartikuláció és annotálás. | ||
# | # Egyik sem. | ||
== Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése? == | |||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | |||
# Sz | |||
# K | |||
# T | |||
# D | |||
== | == Az alábbiak közül melyik segít a beszédhangok határainak jelölésében? == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # Spektogram. | ||
# | # Intenzitás-idő függvény. | ||
# | # Felvétel meghallgatása. | ||
# | # Mindegyik segít benne. | ||
== Az annotálás... == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz. | |||
# A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz. | |||
# A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. | |||
# A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. | |||
== | == Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség? == | ||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # 10 000 bsp | ||
# | # 480 bps | ||
# | # 4800 bps | ||
# | # 1000 bps | ||
# 48 bps | |||
# 48 000 bps | |||
== Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei? == | |||
{{kvízkérdés|típus=több|válasz=3,6|pontozás=-}} | |||
# 1670 Hz | |||
# 600 Hz | |||
# 2980 Hz | |||
# 500 Hz | |||
# 550 Hz | |||
# 100 Hz | |||
== | == Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel? == | ||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # 0,5 kHz-es szinuszjel. | ||
# | # 2 kHz-es szinuszjel. | ||
# | # 3 kHz-es szinuszjel. | ||
# | # 1 kHz-es szinuszjel. | ||
== Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel? == | |||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | |||
# 3,1 kHz-es szinuszjel. | |||
# 1,7 kHz-es szinuszjel. | |||
# 3 kHz-es szinuszjel. | |||
# 1,7 és 3,1 kHz-es szinuszjel. | |||
== Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? == | == Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás? == | ||
147. sor: | 239. sor: | ||
# 63 dB | # 63 dB | ||
# 60 dB | # 60 dB | ||
# 90 | # 90 dB | ||
== Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? == | == Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás? == | ||
191. sor: | 248. sor: | ||
# Papírlap susogása 1 m-ről. | # Papírlap susogása 1 m-ről. | ||
== | == Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 8 kHZ-en | ||
# | # 4 kHz-en | ||
# | # 3,5 kHz-en | ||
# | # 7 kHz-en | ||
# 1 kHz-en | |||
# Sehol, mert kiszűrésre kerül. | |||
== | == Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 8 kHZ-en | ||
# | # 4 kHz-en | ||
# | # 3,5 kHz-en | ||
# | # 7 kHz-en | ||
# 1 kHz-en | |||
# Sehol, mert kiszűrésre kerül. | |||
== | == Egy akusztikus jellemzővektor… == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Egy adott hosszúságú hangrészletet jellemez. | ||
# | # Egy teljes bemondást jellemez. | ||
# | # Egy teljes hangot jellemez. | ||
# | # Egy teljes szót jellemez. | ||
== | == Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # 6 dB | ||
# | # -6 dB | ||
# | # 3 dB | ||
# | # -3 dB | ||
== | == Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=6|pontozás=-}} | ||
# | # Magánhangzót látunk. | ||
# | # Zajt látunk. | ||
# | # Zöngétlen hangot látunk. | ||
# | # Zárhangot látunk. | ||
# Mássalhangzót látunk. | |||
# Zöngés hangot látunk. | |||
== | == Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*) == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=2|pontozás=-}} | ||
# | # Fojtott zöngét látunk. | ||
# | # Egy réshang részletét látjuk. | ||
# | # Túl kvantálási szint van. | ||
# | # A zaj kimaszkolta a jelet. | ||
# MP3 kódolás hibája. | |||
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense. | |||
== | == Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*) == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=2, 5|pontozás=-}} | ||
# | # MP3 kódolás. | ||
# | # Egy réshang részletét látjuk. | ||
# Fojtott zöngét látunk. | |||
# A zaj kimaszkolta a jelet. | |||
# Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél. | |||
# Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense. | |||
# | |||
# | |||
# | |||
# | |||
== Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? == | == Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni? == | ||
268. sor: | 314. sor: | ||
# Egyik sem. | # Egyik sem. | ||
== | == Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=3|pontozás=-}} | ||
# | # -1 | ||
# | # -2 | ||
# | # -6 | ||
# | # -3 | ||
# -4 | |||
# -5 | |||
== | == Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 88 Byte | ||
# | # 44 kByte | ||
# | # 176 kByte | ||
# | # 88 kByte | ||
== | == Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 88 Byte | ||
# | # 44 kByte | ||
# | # 88 kByte | ||
# | # 132 kByte | ||
== | == Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=6|pontozás=-}} | ||
# | # 6 * 6 + 18 * 18 | ||
# | # 24 * 24 + 18 * 5 * 5 | ||
# | # 24 * 24 * 24 | ||
# | # 6 * 18 * 24 | ||
# 24 * 24 | |||
# 24 * 24 + 6 * 18 * 18 | |||
== | == Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # 7 * 19 * 26 | ||
# | # 19 * 19 * 19 + 7 * 7 * 7 | ||
# | # 26 * 26 | ||
# | # 26 * 26 + 7 * 19 * 19 | ||
# 26 * 26 + 26 * 26 * 26 | |||
# 26 * 26 * 26 | |||
== | == Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez? == | ||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # 26 * 26 * 26 + 10 * 10 * 10 | ||
# | # 36 * 36 + 26 * 10 * 10 | ||
# | # 36 * 36 + 10 * 26 * 26 | ||
# | # 36 * 36 * 36 | ||
# 36 * 36 | |||
# 10 * 10 + 26 * 26 | |||
== Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0? == | |||
{{kvízkérdés|típus=több|válasz=6|pontozás=-}} | |||
# 2400 Hz | |||
# 200 kHz | |||
# 12 Hz | |||
# 120 Hz | |||
# 25 Hz | |||
# Nem tudjuk megállapítani. | |||
== | == Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=5,6|pontozás=-}} | ||
# | # 200 Hz | ||
# | # 25 Hz | ||
# | # 400 Hz | ||
# | # 100 Hz | ||
# 125 Hz | |||
# 250 Hz | |||
== | == Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*) == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=|pontozás=-}} | ||
# | # 1000 | ||
# | # 5 | ||
# | # 13 | ||
# | # 200 | ||
# 16 000 | |||
# 80 | |||
== | == Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=3,5|pontozás=-}} | ||
# | # Csak CVC hangkapcsolatokat tartalmaz az adatbázis. | ||
# | # Azonos életkorú beszélőkkel készítjük a felvételeket. | ||
# | # Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist. | ||
# | # Kevés jól megválasztott szó felolvasása is elegendő. | ||
# Különböző korú és nemű emberrel is érdemes felvételt készíteni | |||
# Csak studió körülmények között felvett beszédet lehet használni. | |||
== Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” == | == Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.” == | ||
338. sor: | 407. sor: | ||
# 70 Hz | # 70 Hz | ||
== | == Hogy hívják az egyenlő hangosság érzetű görbét? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Phon | ||
# | # Phön | ||
# | # Schön | ||
# | # Decibel | ||
== | == Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # Személyfüggő kapcsolat van. | ||
# | # Függetlenek tőle. | ||
# | # Az alapfrekvencia egészszámú többszöröseinél vannak. | ||
# | # Az alapfrekvencia páratlan egészszámú többszöröseinél vannak. | ||
== | == Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet? == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Zönge | ||
# | # Zengő | ||
# | # Vokál | ||
# | # Spektrál | ||
== | == Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # Felharmonikus | ||
# | # Alapfrekvencia | ||
# | # Formáns | ||
# | # Oktáv | ||
== | == Hogyan változik meg egy felpattanó zárhang nyújtáskor? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # Az energiája megnő. | ||
# | # Megismétlődik a felpattanó rész. | ||
# | # Zárrész megnyúlik. | ||
# | # Megnő az alapfrekvenciája. | ||
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya | == Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# 8 bites | # 8 bites | ||
# 12 bites | # 12 bites | ||
401. sor: | 449. sor: | ||
# 16 bites | # 16 bites | ||
== Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya | == Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# 8 bites | # 8 bites | ||
# 12 bites | # 12 bites | ||
# 4 bites | # 4 bites | ||
# 16 bites | # 16 bites | ||
== Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? == | == Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1,7|pontozás=-}} | ||
# 1600 | # 1600 | ||
# 10 000 | # 10 000 | ||
# 256 | # 256 | ||
# 64 | # 64 | ||
# 39 * 39 * 39 | # 39 * 39 * 39 | ||
# 25 + 14 | # 25 + 14 | ||
# 39 * 39 | # 39 * 39 | ||
# 25 * 25 * 14 + 25 * 25 | # 25 * 25 * 14 + 25 * 25 | ||
== Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? == | == Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig? == | ||
457. sor: | 474. sor: | ||
# 250 | # 250 | ||
== Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? | == Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567? == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# 1000 | # 1000 | ||
464. sor: | 481. sor: | ||
# 250 | # 250 | ||
== | == Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik. == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Igaz | ||
# Hamis | |||
# | |||
== | == Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1|pontozás=-}} | ||
# | # Egó | ||
# | # Lás | ||
# | # Sen | ||
# | # átp | ||
# Csók | |||
# Rak | |||
== | == LPC analízisnél előállított maradékjelre mi jellemző? == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # Kinyerhetők belőle a formánsfrekvencia értékek. | ||
# | # Több biten kvantálható, mint az eredeti jel. | ||
# | # Az a jel a maradékjel, ami nem fért bele az analízisablakba. | ||
# | # LPC szintézis megvalósítható az eredeti maradékjel nélkül is. | ||
# | # Eldobható az eredeti jel enélkül is visszaállítható. | ||
# Nagyobb az energiája az eredeti jelnél. | |||
== Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? == | == Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez? == | ||
493. sor: | 511. sor: | ||
# 2 | # 2 | ||
== | == Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1,5|pontozás=-}} | ||
# | # Hangszalagok | ||
# | # Szájüreg | ||
# | # Orrüreg | ||
# | # Garat | ||
# Tüdő | |||
# Nyelv | |||
== Mely hang(ok) zöngétlen(ek)? == | |||
{{kvízkérdés|típus=több|válasz=2,9|pontozás=-}} | |||
# D | |||
# Cs | |||
# L | |||
# Dz | |||
# V | |||
# G | |||
# Zs | |||
# Z | |||
# K | |||
== | == Mely állítás(ok) igaz(ak) a kvantálási zajra? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=5,6|pontozás=-}} | ||
# | # Csak 6 bit alatti kvantálásnál létezik. | ||
# | # Értéke nem meghatározható, mert a használt mikrofontól függ. | ||
# | # Függ a mintavételi frekvenciától. | ||
# | # Csak logaritmikus kvantálásnál jelentkezik. | ||
# Függ a kvantálási lépcsők számától. | |||
# Lineáris kvantálásnál is létezik. | |||
== | == Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # HMM statisztikai TTS. | ||
# | # WaveNet TTS. | ||
# | # Kempelen gépe. | ||
# | # Diád alapú hullámforma. | ||
== | == Melyik hang(ok)nak van periodikus szakasza? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1,2,7,8|pontozás=-}} | ||
# | # L | ||
# | # M | ||
# | # Sz | ||
# | # F | ||
# S | |||
# H | |||
# J | |||
# Ny | |||
== | == Melyik hangnak a legmagasabb az F2 értéke? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # I | ||
# | # A | ||
# | # U | ||
# | # E | ||
== Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? == | == Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta? == | ||
534. sor: | 572. sor: | ||
# Az első 256 komponensét. | # Az első 256 komponensét. | ||
# Az első 512 komponensét. | # Az első 512 komponensét. | ||
== Melyik koszinusz jelnek a legkisebb az intenzitása? == | == Melyik koszinusz jelnek a legkisebb az intenzitása? == | ||
599. sor: | 582. sor: | ||
# 18 kHz / 99 dB | # 18 kHz / 99 dB | ||
== | == Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# Korpusz alapú elem összefűzős rendszer. | |||
# Diád építőelemes beszédszintetizáló rendszer. | |||
# Formás szintézis. | |||
# Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS). | |||
== Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe? == | |||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | |||
# Korpusz alapú elem összefűzős rendszer. | |||
# Diád építőelemes beszédszintetizáló rendszer. | |||
# Formás szintézis. | |||
# Beszéddetektáló rendszer. | |||
== Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie? == | |||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # Korpusz alapú elem összefűzős rendszer. | ||
# | # Diád építőelemes beszédszintetizáló rendszer. | ||
# | # Formás szintézis. | ||
# | # Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS). | ||
# | |||
# | == Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez? == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | |||
# Korpusz alapú elem összefűzős rendszer. | |||
# Diád építőelemes beszédszintetizáló rendszer. | |||
# Formás szintézis. | |||
# Beszéddetektáló rendszer. | |||
== | == Melyik nem játszik közvetlen szerepet a hallásban? == | ||
{{kvízkérdés|típus=több|válasz= | {{kvízkérdés|típus=több|válasz=3,5|pontozás=-}} | ||
# | # Eustach-kürt | ||
# | # Kalapács | ||
# | # Patkó | ||
# | # Dobhártya | ||
# | # Kasza | ||
# | # Üllő | ||
== | == Melyik szinusz jelet halljuk a leghangosabbnak? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # 40 Hz-es 45 dB | ||
# | # 1 kHz-es 50 dB | ||
# | # 2 kHz-es 49 dB | ||
# | # 10 kHz-es 51 dB | ||
== | == Melyik szinusz jelnek a legnagyobb az intenzitása? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# - | # 40 Hz-es 45 dB | ||
# - | # 1 kHz-es 50 dB | ||
# - | # 2 kHz-es 49 dB | ||
# - | # 10 kHz-es 51 dB | ||
== | == Melyik szinusz jelnek legkisebb az intenzitása? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # 40 Hz-es 45 dB | ||
# | # 1 kHz-es 50 dB | ||
# | # 2 kHz-es 49 dB | ||
# | # 10 kHz-es 51 dB | ||
== | == Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=5|pontozás=-}} | ||
# | # Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek. | ||
# | # A beszéd gépi generálásánál a természetes beszédritmikát állítja elő. | ||
# | # Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő. | ||
# | # Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére. | ||
# | # Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható. | ||
== Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra? == | |||
{{kvízkérdés|típus=több|válasz=1,3|pontozás=-}} | |||
# Módosíthatja a hangidőtartamot. | |||
# MFCC paramétereket számolunk vele. | |||
# Pitch Synchronous Overlap and Add-nek a rövidítése. | |||
# Megszünteti a frekvenciaelfedés jelenséget. | |||
# Módosítható vele a mintavételi frekvencia. | |||
# Beszédfelismerésben használt. | |||
== | == Melyik állítás(ok) igaz(ak)? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=5|pontozás=-}} | ||
# | # Beszédre csak lineáris kvantálást használunk. | ||
# | # LPC-10 kódoló csak a zöngés részt kódolja. | ||
# | # MP3 kódolás veszteségmentesen visszaállítható beszéd esetén. | ||
# | # A-törvényű (A-law) kvantálás lineáris. | ||
# | # A beszédkódolók minősége nem csak a bitsebességtől függ. | ||
# | # Logaritmikus kvantálás veszteségmentesen visszaállítható. | ||
== | == Melyiket használjuk az alábbiak közül betű-hang átalakításra? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # PAMPA | ||
# SAMPA | |||
# PUMPA | |||
# | # SAMBA | ||
# | |||
# | |||
== | == Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 20 – 20 000 Hz | ||
# | # 30 – 3400 Hz | ||
# | # 6000 – 10 000 Hz | ||
# | # 300 – 4000 Hz | ||
# | # 1000 – 7000 Hz | ||
== Mi a Tacotron 2? == | == Mi a Tacotron 2? == | ||
698. sor: | 698. sor: | ||
# Egy HMM alapú hullámforma generáló rendszer. | # Egy HMM alapú hullámforma generáló rendszer. | ||
# End-to-end rendszer. | # End-to-end rendszer. | ||
== Mi a WaveNet? == | == Mi a WaveNet? == | ||
808. sor: | 709. sor: | ||
# Egy mély neurális háló alapú hullámforma generáló rendszer. | # Egy mély neurális háló alapú hullámforma generáló rendszer. | ||
== | == Mi az akusztikai dB mértékegysége? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # W/m2 | ||
# | # N/m2 | ||
# | # M/s2 | ||
# | # Mértékegység nélküli. | ||
# | |||
# | == Mi hangnyomás mértékegysége? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# W/m2 | |||
# N/m2 | |||
# M/s2 | |||
# Mértékegység nélküli. | |||
== | == Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1,6|pontozás=-}} | ||
# | # A jel tulajdonságaihoz képest alacsony mintavételi frekvencia. | ||
# | # A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás. | ||
# | # Lineáris predikciós kódolás. | ||
# | # Erős háttérzaj a beszéd felvétele közben. | ||
# | # A jel tulajdonságaihoz képest túl magas mintavételi frekvencia. | ||
# | # A bemeneti aluláteresztő szűrő hiánya. | ||
== | == Mi igaz az F0, F1, F2 értékekre? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # F1 és F2 gyakorlatilag független F0-tól. | ||
# | # F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének. | ||
# | # F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük. | ||
# | # F0 a nulladik formáns, F1 az első, F2 pedig a második. | ||
== | == Mi jellemző a "p" hangra? == | ||
{{kvízkérdés|típus=több|válasz= | {{kvízkérdés|típus=több|válasz=2|pontozás=-}} | ||
# | # Zöngés. | ||
# | # Zárhang. | ||
# Felpattanás a hang | # Felpattanás a hang elején található. | ||
# | # F2 értéke magas. | ||
# | # Nazális. | ||
# Fojtott | # Fojtott zöngét tartalmaz. | ||
== Mi jellemző a formánsokra? == | == Mi jellemző a formánsokra? == | ||
{{kvízkérdés|típus=több|válasz=3,4|pontozás=-}} | {{kvízkérdés|típus=több|válasz=3,4,8,10|pontozás=-}} | ||
# A néma fázisoknál is megmérhető. | # A néma fázisoknál is megmérhető. | ||
# Értékük független a beszélő nemétől. | # Értékük független a beszélő nemétől. | ||
852. sor: | 756. sor: | ||
# A magánhangzóknak 1440 db formánsa van. | # A magánhangzóknak 1440 db formánsa van. | ||
# Vonalas spektrum esetén nem meghatározható. | # Vonalas spektrum esetén nem meghatározható. | ||
# Női beszélőknél jellemzően alacsonyabb értékeket vesz fel. | # Női beszélőknél jellemzően alacsonyabb értékeket vesz fel. | ||
# Nem csak az F0 egész számú többszöröse lehet. | # Nem csak az F0 egész számú többszöröse lehet. | ||
860. sor: | 761. sor: | ||
# A hang spektrumából meghatározható. | # A hang spektrumából meghatározható. | ||
# Nem függ a beszédhangtól. | # Nem függ a beszédhangtól. | ||
== | == Mi jellemző a μ-law kódolásra? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=5|pontozás=-}} | ||
# | # A HMM beszédfelismerés előfeldolgozója. | ||
# | # μ meredekségű lineáris kvantálás. | ||
# | # Négyzetes kvantálású. | ||
# | # 8 bites lineáris kvantálás. | ||
# | # Nagy amplitúdó esetén ritkább a kvantálás. | ||
# | # MFCC paraméterei. | ||
== | == Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal? == | ||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén. | ||
# | # Alapfrekvenciája magasabb lesz, mint a mondat kezdetén. | ||
# | # A zöngés hang zöngétlenedik. | ||
# | # A zöngés hang felhangosodik. | ||
== | == Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # Más lesz a felharmonikusok menete a mondat közepén. | ||
# | # Más az alapfrekvencia menete. | ||
# | # Változatlan marad. | ||
# | # Formánsok megváltoznak. | ||
== | == Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | ||
# | # A 'p' zöngétlen hang, a 'b' zöngés. | ||
# | # Csak a ’p’-nek vannak zajkomponensei. | ||
# A ’b’ időben összetett szerkezetű, a ’p’ nem. | |||
# | # Csak a zajkomponensek frekvenciahelyei térnek el. | ||
# | |||
== | == Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre? == | ||
{{kvízkérdés|típus=több|válasz= | {{kvízkérdés|típus=több|válasz=3,4|pontozás=-}} | ||
# | # Szép, természetes hangzás. | ||
# | # Biztosítja a hanszínezet megtartását új hanfelvételnél. | ||
# | # Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez. | ||
# | # Minden hangkapcsolódást jó akusztikai formában elő tud állítani. | ||
== | == Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=több|válasz=1,2,3|pontozás=-}} | ||
# | # Szép, természetes hangzás. | ||
# | # Biztosítja a hanszínezet megtartását új hanfelvételnél. | ||
# | # Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez. | ||
# Minden hangkapcsolódást jó akusztikai formában elő tud állítani. | |||
# | |||
== | == Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál? == | ||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | ||
# | # Jel-idő függvény alapon. | ||
# | # LPC alapú TTS-en. | ||
# | # Időtengely alapon. | ||
# | # Frekvencia-jel függvény alapon. | ||
# | |||
# | == Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia. | |||
# 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia. | |||
# 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia. | |||
# 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia. | |||
== | == Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás? == | ||
{{kvízkérdés|típus=egy|válasz= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # HMM alapú statisztikai parametrikus TTS. | ||
# | # Diád alapú hullámforma összefűzéses TTS. | ||
# | # LPC alapú TTS. | ||
# | # Kempelen beszélő gépe. | ||
== | == Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 20 Hz - 30 Hz | ||
# | # 20 kHz - 30 kHz | ||
# | # 10 Hz - 20 Hz | ||
# | # 3 kHz - 10 kHz | ||
# | # 50 Hz - 5 kHz | ||
# | # 5 kHz - 10 kHz | ||
== | == Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma? == | ||
{{kvízkérdés|típus=egy|válasz=5|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=5|pontozás=-}} | ||
# | # 20 Hz - 30 Hz | ||
# | # 20 kHz - 30 kHz | ||
# | # 10 Hz - 20 Hz | ||
# | # 15 kHz - 20 kHz | ||
# | # 50 Hz - 5 kHz | ||
# 5 kHz - 10 kHz | |||
== | == Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni." == | ||
{{kvízkérdés|típus=egy|válasz=6|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=6|pontozás=-}} | ||
# | # 5900 μs | ||
# | # 900 ms | ||
# | # 2500 μs | ||
# | # 30 s | ||
# | # 45 s | ||
# | # 5800 ms | ||
== Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség." == | |||
{{kvízkérdés|típus=több|válasz=5|pontozás=-}} | |||
# 1800 μs | |||
# 45 s | |||
# 30 s | |||
# 900 ms | |||
# 2000 ms | |||
# 5800 μs | |||
== Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. == | == Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk. == | ||
969. sor: | 872. sor: | ||
# 10 hang | # 10 hang | ||
== | == Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki? == | ||
{{kvízkérdés|típus=több|válasz= | {{kvízkérdés|típus=több|válasz=4|pontozás=-}} | ||
# | # 200 ms | ||
# | # 1 ms | ||
# | # 100 μs | ||
# | # 4 ms | ||
# | # 40 ms | ||
# | # 400 μs | ||
== Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül? == | |||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | |||
# 78 dBA | |||
# 800 dBA | |||
# 18 dBA | |||
# 138 dBA | |||
# 8 dBA | |||
# -18 dBA | |||
== Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek? == | |||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | |||
# 16 kHz | |||
# 8 kHz | |||
# 1 kHz | |||
# 2 kHz | |||
== Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez? == | |||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | |||
# F0, F1, F2, F3 | |||
# B1, B2, B3, F0, F1, F2, F3 | |||
# Zönge, zörej, F0, F1, F2, F3, hangerő | |||
# Zönge, zörej, F1, F2, F3, F4, hangerő | |||
== | == Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság) == | ||
{{kvízkérdés|típus=egy|válasz=|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # F0, F1, F2, F3 | ||
# B1, B2, B3, B4, B5 | |||
# Zönge, zörej, F0, F1, F2, F3, hangerő | |||
# | # Zönge, zörej, F1, F2, F3, F4, hangerő | ||
# | |||
# | |||
== | == Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia. | ||
# | # 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia. | ||
# | # 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia. | ||
# | # 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia. | ||
== | == Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | ||
# | # Folytonos | ||
# | # Vonalas | ||
# | # Elkent | ||
# | # Felkent | ||
== | == Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez? == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 32 | ||
# | # 20 | ||
# | # 3 | ||
# | # 7 | ||
== | == Mire jó a Gaussian Mixture Model (GMM)? == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # Mindenre, amire a HMM is. | ||
# | # Csak a HMM-mel kiegészítésben használható. | ||
# | # Időillesztésre. | ||
# | # Hasonlósági mérték számítására. | ||
# 1 | |||
# | == Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva? == | ||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# Hogy a magánhangzók érthetőbbek legyenek. | |||
# Hogy ne legyen „huppogós” a beszéd. | |||
# Hogy a zárhangok érthetőbbek legyenek. | |||
# Hogy a réshangok érthetőbbek legyenek. | |||
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig? == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# 40 | |||
# 20 | |||
# 100 | |||
# 200 | |||
# 8 | |||
# 4 | |||
== Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? == | |||
{{kvízkérdés|típus=egy|válasz=1|pontozás=-}} | |||
# 40 | |||
# 20 | |||
# 100 | |||
# 200 | |||
# 8 | |||
# 4 | |||
== Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig? == | |||
{{kvízkérdés|típus=egy|válasz=2|pontozás=-}} | |||
# 40 | |||
# 20 | |||
# 100 | |||
# 200 | |||
# 8 | |||
# 4 | |||
== | == PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk? == | ||
{{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 375 ms | ||
# | # 280 ms | ||
# 3 | # 350 ms | ||
# | # 325 ms | ||
# | # 200 ms | ||
# | # 240 ms | ||
== Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni? == | |||
{{kvízkérdés|típus=egy|válasz=3|pontozás=-}} | |||
# 180 | |||
# 200 | |||
# 256 | |||
# 25 | |||
== | == Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva... == | ||
{{kvízkérdés|típus= | {{kvízkérdés|típus=egy|válasz=4|pontozás=-}} | ||
# | # 9 kHz körüli beszédkomponens biztosan kiszűrthető. | ||
# | # átlapolódást (aliasing) kivédtük. | ||
# A hangminőség a telefonosnál biztosan jobb lesz. | |||
# A | # Többnyire érthető, de zajos lesz a jel. | ||
# | # Biztosan érthetetlen, használhatatlan lesz a kimenet. | ||
# |
A lap 2023. november 16., 16:39-kori változata
10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?
- Benzinmotoros fűnyíró 1,5m-ről.
- Normál beszéd 1m-ről.
- Sugárhajtású repülő hajtóműve 15m-ről.
- Suttogó beszéd 10m-ről.
- Elhaladó vonat 2m-ről.
- Erős közúti forgalom 1m-ről.
16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel?
- Érthetetlen lesz az átlapolódás miatt.
- Csak a mássalhangzók maradnak meg.
- Veszteségmentesen tárolható.
- Alig érhető marad a beszéd.
- Csak az alapfrekvencia marad meg.
- Majdnem tökéletesen megmarad a beszéd.
60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?
- Benzinmotoros fűnyíró 1,5m-ről.
- Normál beszéd 1m-ről.
- Sugárhajtású repülő hajtóműve 15m-ről.
- Suttogó beszéd 10m-ről.
- Elhaladó vonat 2m-ről.
- Erős közúti forgalom 1m-ről.
A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?
- 7 triád
- 15 diád
- 19 diád
- 5 diád + 7 triád
- 10 diád + 10 triád
- 3 diád + 8 triád
A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek?
- A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
- Nagy energiájú hang lesz.
- Felpattanás a hang elejére kerül.
- Több mint 100 ms hosszú a "p" hang.
- A némafázisa nem hosszabb mint 100 μs.
- Fojtott zönge legalább 100 ms lesz.
A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?
- A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
- Nagy energiájú hang lesz.
- Felpattanás a hang elejére kerül.
- Több mint 100 ms hosszú a "t" hang.
- A némafázisa nem hosszabb mint 100 μs.
- Fojtott zönge legalább 100 ms lesz.
A Viterbi-algoritmus…
- A GMM paraméterek gyors közelítő számítására használható.
- A HMM paraméterek gyors közelítő számítására használható.
- Adja meg a beszédfelismerésnél a helyes eredményt.
- A HMM legjobb illeszkedésű útvonalát mindig megtalálja.
A felharmonikusok definíció szerint…
- Megegyeznek a formánsok középfrekvenciáival.
- Az alapfrekvencia egész számú többszörösei.
- A rezonátorüreg által felerősített felhangnyalábok.
- Az alapfrekvencia páratlan, egészszámú többszörösei.
A felharmonikusok és az alapfrekvencia között milyen összefüggés van?
- Az alapfrekvenciát a felharmonikusokkal maradék nélkül tudjuk osztani.
- A felharmonikusok az alapfrekvencia egész számú többszörösei.
- A felharmonikusok az alapfrekvenciának mindig a kétszerese.
- Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.
A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni?
- Forrás-szűrő.
- Jel-szűrő.
- Frekvencia-szűrő.
- Intenzitás-szűrő.
A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél?
- C-k
- V-k
- Nazálisok
- Zárhangok
A kvantálás(t)...
- Lépésköze függ a mintavételi frekvenciától.
- Lépésköze nem függ a mintavételi frekvenciától.
- Veszteségmentesen visszaállítható.
- Lépésköze nem befolyásolja a hangminőséget.
- Csak egyenletes közökkel használják beszédre.
- Függ a beszéd alapfrekvenciájától.
A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?
- Kb. 135 Hz
- Kb. 320 Hz
- Kb. 65 Hz
- Kb. 200 Hz
- Kb. 220 Hz
- Kb. 35 Hz
- Kb. 140 Hz
- Kb. 70 Hz
A rejtett Markov modelleket (HMM)...
- Minden esetben helyettesíthetjük Markov láncokkal.
- A Viterbi-algoritmussal taníthatjuk be.
- A GMM-ekkel együtt lehet beszédfelismerésre használni.
- Csak a GMM-mel kiegészítésben használhatjuk bármi is.
A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A “hasát” szóban milyen hang található?
- Pergő rész
- Nazális
- Réshang
- Zöngés zárhang
A “sás” szót kiejtve milyen rész található a beszédjelben?
- Pergő rész
- Nazális
- Zöngés rész
- Zöngés zárhang
A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia?
- á
- Záró „k”
- U
- A
A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni?
- A b felpattanás elé szünetet kell beiktatni.
- A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
- A b előtti zár szakaszt csendre kell cserélni.
- Nem megvalósítható.
Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz!
- Szöveg gyűjtése.
- Hang felvétele mester mondattal.
- Szótagokra vágás.
- Fonetikai átirat és hanghatár bejelölése minden mondatra.
Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához?
- Annotálás és szegmentálás.
- Szupraszegmentálás és koartikuláció.
- Koartikuláció és annotálás.
- Egyik sem.
Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése?
- Sz
- K
- T
- D
Az alábbiak közül melyik segít a beszédhangok határainak jelölésében?
- Spektogram.
- Intenzitás-idő függvény.
- Felvétel meghallgatása.
- Mindegyik segít benne.
Az annotálás...
- A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
- A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
- A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
- A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség?
- 10 000 bsp
- 480 bps
- 4800 bps
- 1000 bps
- 48 bps
- 48 000 bps
Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?
- 1670 Hz
- 600 Hz
- 2980 Hz
- 500 Hz
- 550 Hz
- 100 Hz
Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel?
- 0,5 kHz-es szinuszjel.
- 2 kHz-es szinuszjel.
- 3 kHz-es szinuszjel.
- 1 kHz-es szinuszjel.
Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel?
- 3,1 kHz-es szinuszjel.
- 1,7 kHz-es szinuszjel.
- 3 kHz-es szinuszjel.
- 1,7 és 3,1 kHz-es szinuszjel.
Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás?
- 120 dB
- 63 dB
- 60 dB
- 90 dB
Egy 60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?
- Normál beszéd 1 m-ről.
- Sugárhajtású gép hajtóműve 5 m-ről.
- Haladó kamion 2 m-ről.
- Papírlap susogása 1 m-ről.
Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?
- 8 kHZ-en
- 4 kHz-en
- 3,5 kHz-en
- 7 kHz-en
- 1 kHz-en
- Sehol, mert kiszűrésre kerül.
Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?
- 8 kHZ-en
- 4 kHz-en
- 3,5 kHz-en
- 7 kHz-en
- 1 kHz-en
- Sehol, mert kiszűrésre kerül.
Egy akusztikus jellemzővektor…
- Egy adott hosszúságú hangrészletet jellemez.
- Egy teljes bemondást jellemez.
- Egy teljes hangot jellemez.
- Egy teljes szót jellemez.
Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent?
- 6 dB
- -6 dB
- 3 dB
- -3 dB
Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?
- Magánhangzót látunk.
- Zajt látunk.
- Zöngétlen hangot látunk.
- Zárhangot látunk.
- Mássalhangzót látunk.
- Zöngés hangot látunk.
Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)
- Fojtott zöngét látunk.
- Egy réshang részletét látjuk.
- Túl kvantálási szint van.
- A zaj kimaszkolta a jelet.
- MP3 kódolás hibája.
- Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)
- MP3 kódolás.
- Egy réshang részletét látjuk.
- Fojtott zöngét látunk.
- A zaj kimaszkolta a jelet.
- Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
- Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni?
- Profi bemondó, változatos hanganyag.
- Több beszélő, szavak felolvasása.
- Egy bemondó, egy hang kitartása.
- Egyik sem.
Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása?
- -1
- -2
- -6
- -3
- -4
- -5
Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén?
- 88 Byte
- 44 kByte
- 176 kByte
- 88 kByte
Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén?
- 88 Byte
- 44 kByte
- 88 kByte
- 132 kByte
Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?
- 6 * 6 + 18 * 18
- 24 * 24 + 18 * 5 * 5
- 24 * 24 * 24
- 6 * 18 * 24
- 24 * 24
- 24 * 24 + 6 * 18 * 18
Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez?
- 7 * 19 * 26
- 19 * 19 * 19 + 7 * 7 * 7
- 26 * 26
- 26 * 26 + 7 * 19 * 19
- 26 * 26 + 26 * 26 * 26
- 26 * 26 * 26
Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?
- 26 * 26 * 26 + 10 * 10 * 10
- 36 * 36 + 26 * 10 * 10
- 36 * 36 + 10 * 26 * 26
- 36 * 36 * 36
- 36 * 36
- 10 * 10 + 26 * 26
Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?
- 2400 Hz
- 200 kHz
- 12 Hz
- 120 Hz
- 25 Hz
- Nem tudjuk megállapítani.
Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?
- 200 Hz
- 25 Hz
- 400 Hz
- 100 Hz
- 125 Hz
- 250 Hz
Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában? (*)
- 1000
- 5
- 13
- 200
- 16 000
- 80
Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?
- Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
- Azonos életkorú beszélőkkel készítjük a felvételeket.
- Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
- Kevés jól megválasztott szó felolvasása is elegendő.
- Különböző korú és nemű emberrel is érdemes felvételt készíteni
- Csak studió körülmények között felvett beszédet lehet használni.
Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.”
- 10 Hz
- 100 Hz
- 20 Hz
- 70 Hz
Hogy hívják az egyenlő hangosság érzetű görbét?
- Phon
- Phön
- Schön
- Decibel
Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz?
- Személyfüggő kapcsolat van.
- Függetlenek tőle.
- Az alapfrekvencia egészszámú többszöröseinél vannak.
- Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.
Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet?
- Zönge
- Zengő
- Vokál
- Spektrál
Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait?
- Felharmonikus
- Alapfrekvencia
- Formáns
- Oktáv
Hogyan változik meg egy felpattanó zárhang nyújtáskor?
- Az energiája megnő.
- Megismétlődik a felpattanó rész.
- Zárrész megnyúlik.
- Megnő az alapfrekvenciája.
Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB?
- 8 bites
- 12 bites
- 4 bites
- 16 bites
Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB?
- 8 bites
- 12 bites
- 4 bites
- 16 bites
Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?
- 1600
- 10 000
- 256
- 64
- 39 * 39 * 39
- 25 + 14
- 39 * 39
- 25 * 25 * 14 + 25 * 25
Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig?
- 1000
- 9
- 25
- 250
Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567?
- 1000
- 9
- 25
- 250
Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
- Igaz
- Hamis
Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge?
- Egó
- Lás
- Sen
- átp
- Csók
- Rak
LPC analízisnél előállított maradékjelre mi jellemző?
- Kinyerhetők belőle a formánsfrekvencia értékek.
- Több biten kvantálható, mint az eredeti jel.
- Az a jel a maradékjel, ami nem fért bele az analízisablakba.
- LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
- Eldobható az eredeti jel enélkül is visszaállítható.
- Nagyobb az energiája az eredeti jelnél.
Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez?
- 168
- 10
- 40
- 2
Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?
- Hangszalagok
- Szájüreg
- Orrüreg
- Garat
- Tüdő
- Nyelv
Mely hang(ok) zöngétlen(ek)?
- D
- Cs
- L
- Dz
- V
- G
- Zs
- Z
- K
Mely állítás(ok) igaz(ak) a kvantálási zajra?
- Csak 6 bit alatti kvantálásnál létezik.
- Értéke nem meghatározható, mert a használt mikrofontól függ.
- Függ a mintavételi frekvenciától.
- Csak logaritmikus kvantálásnál jelentkezik.
- Függ a kvantálási lépcsők számától.
- Lineáris kvantálásnál is létezik.
Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához?
- HMM statisztikai TTS.
- WaveNet TTS.
- Kempelen gépe.
- Diád alapú hullámforma.
Melyik hang(ok)nak van periodikus szakasza?
- L
- M
- Sz
- F
- S
- H
- J
- Ny
Melyik hangnak a legmagasabb az F2 értéke?
- I
- A
- U
- E
Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta?
- Az első 226 komponensét.
- Az első 128 komponensét.
- Az első 256 komponensét.
- Az első 512 komponensét.
Melyik koszinusz jelnek a legkisebb az intenzitása?
- 7000 Hz / 65 phon
- 1 kHz / 60 db
- 1000 Hz/ 61 phon
- 20 Hz / 59 phon
- 500 Hz / 120 dB
- 18 kHz / 99 dB
Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszéddetektáló rendszer.
Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszéddetektáló rendszer.
Melyik nem játszik közvetlen szerepet a hallásban?
- Eustach-kürt
- Kalapács
- Patkó
- Dobhártya
- Kasza
- Üllő
Melyik szinusz jelet halljuk a leghangosabbnak?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik szinusz jelnek a legnagyobb az intenzitása?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik szinusz jelnek legkisebb az intenzitása?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?
- Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
- A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
- Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
- Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
- Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.
Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?
- Módosíthatja a hangidőtartamot.
- MFCC paramétereket számolunk vele.
- Pitch Synchronous Overlap and Add-nek a rövidítése.
- Megszünteti a frekvenciaelfedés jelenséget.
- Módosítható vele a mintavételi frekvencia.
- Beszédfelismerésben használt.
Melyik állítás(ok) igaz(ak)?
- Beszédre csak lineáris kvantálást használunk.
- LPC-10 kódoló csak a zöngés részt kódolja.
- MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
- A-törvényű (A-law) kvantálás lineáris.
- A beszédkódolók minősége nem csak a bitsebességtől függ.
- Logaritmikus kvantálás veszteségmentesen visszaállítható.
Melyiket használjuk az alábbiak közül betű-hang átalakításra?
- PAMPA
- SAMPA
- PUMPA
- SAMBA
Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya?
- 20 – 20 000 Hz
- 30 – 3400 Hz
- 6000 – 10 000 Hz
- 300 – 4000 Hz
- 1000 – 7000 Hz
Mi a Tacotron 2?
- Egy beszédátvitelt szabványosító szervezet.
- Egy mély neurálisháló alapú rendszer.
- Beszédalapú helymeghatározási megoldás.
- Egy beszédfelismerő eszköz.
- Egy HMM alapú hullámforma generáló rendszer.
- End-to-end rendszer.
Mi a WaveGlow?
- Egy beszédátvitelt szabványosító szervezet.
- Egy mély neurálisháló alapú rendszer.
- Beszédalapú helymeghatározási megoldás.
- Egy folyamat alapú beszédgeneráló rendszer.
- Egy HMM alapú hullámforma generáló rendszer.
- End-to-end rendszer.
Mi a WaveNet?
- Ultrahangos beszédrögzítő készülék.
- Egy beszédátvitelt szabványosító szervezet.
- Egy hullámforma generáló rendszer, amely gépi tanuláson alapul.
- Beszéd alapú helymeghatározási megoldás.
- Egy DNN alapú hullámforma generáló rendszer.
- Egy HMM alapú hullámforma generáló rendszer.
- Egy mély neurális háló alapú hullámforma generáló rendszer.
Mi az akusztikai dB mértékegysége?
- W/m2
- N/m2
- M/s2
- Mértékegység nélküli.
Mi hangnyomás mértékegysége?
- W/m2
- N/m2
- M/s2
- Mértékegység nélküli.
Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?
- A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
- A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
- Lineáris predikciós kódolás.
- Erős háttérzaj a beszéd felvétele közben.
- A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
- A bemeneti aluláteresztő szűrő hiánya.
Mi igaz az F0, F1, F2 értékekre?
- F1 és F2 gyakorlatilag független F0-tól.
- F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
- F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
- F0 a nulladik formáns, F1 az első, F2 pedig a második.
Mi jellemző a "p" hangra?
- Zöngés.
- Zárhang.
- Felpattanás a hang elején található.
- F2 értéke magas.
- Nazális.
- Fojtott zöngét tartalmaz.
Mi jellemző a formánsokra?
- A néma fázisoknál is megmérhető.
- Értékük független a beszélő nemétől.
- Az F2 meghatározza a magánhangzó hangrendjét.
- Az alapfrekvenciánál nagyobb az értékük.
- A magánhangzóknak 1440 db formánsa van.
- Vonalas spektrum esetén nem meghatározható.
- Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
- Nem csak az F0 egész számú többszöröse lehet.
- A magánhangzók 1140 db formánsa van.
- A hang spektrumából meghatározható.
- Nem függ a beszédhangtól.
Mi jellemző a μ-law kódolásra?
- A HMM beszédfelismerés előfeldolgozója.
- μ meredekségű lineáris kvantálás.
- Négyzetes kvantálású.
- 8 bites lineáris kvantálás.
- Nagy amplitúdó esetén ritkább a kvantálás.
- MFCC paraméterei.
Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal?
- Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
- Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
- A zöngés hang zöngétlenedik.
- A zöngés hang felhangosodik.
Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont?
- Más lesz a felharmonikusok menete a mondat közepén.
- Más az alapfrekvencia menete.
- Változatlan marad.
- Formánsok megváltoznak.
Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől?
- A 'p' zöngétlen hang, a 'b' zöngés.
- Csak a ’p’-nek vannak zajkomponensei.
- A ’b’ időben összetett szerkezetű, a ’p’ nem.
- Csak a zajkomponensek frekvenciahelyei térnek el.
Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre?
- Szép, természetes hangzás.
- Biztosítja a hanszínezet megtartását új hanfelvételnél.
- Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
- Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre?
- Szép, természetes hangzás.
- Biztosítja a hanszínezet megtartását új hanfelvételnél.
- Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
- Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál?
- Jel-idő függvény alapon.
- LPC alapú TTS-en.
- Időtengely alapon.
- Frekvencia-jel függvény alapon.
Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez?
- 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
- 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
- 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
- 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás?
- HMM alapú statisztikai parametrikus TTS.
- Diád alapú hullámforma összefűzéses TTS.
- LPC alapú TTS.
- Kempelen beszélő gépe.
Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma?
- 20 Hz - 30 Hz
- 20 kHz - 30 kHz
- 10 Hz - 20 Hz
- 3 kHz - 10 kHz
- 50 Hz - 5 kHz
- 5 kHz - 10 kHz
Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma?
- 20 Hz - 30 Hz
- 20 kHz - 30 kHz
- 10 Hz - 20 Hz
- 15 kHz - 20 kHz
- 50 Hz - 5 kHz
- 5 kHz - 10 kHz
Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni."
- 5900 μs
- 900 ms
- 2500 μs
- 30 s
- 45 s
- 5800 ms
Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség."
- 1800 μs
- 45 s
- 30 s
- 900 ms
- 2000 ms
- 5800 μs
Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk.
- 4 hang
- 9 hang
- 3 hang
- 6 hang
- 5 hang
- 10 hang
Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki?
- 200 ms
- 1 ms
- 100 μs
- 4 ms
- 40 ms
- 400 μs
Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?
- 78 dBA
- 800 dBA
- 18 dBA
- 138 dBA
- 8 dBA
- -18 dBA
Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek?
- 16 kHz
- 8 kHz
- 1 kHz
- 2 kHz
Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez?
- F0, F1, F2, F3
- B1, B2, B3, F0, F1, F2, F3
- Zönge, zörej, F0, F1, F2, F3, hangerő
- Zönge, zörej, F1, F2, F3, F4, hangerő
Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság)
- F0, F1, F2, F3
- B1, B2, B3, B4, B5
- Zönge, zörej, F0, F1, F2, F3, hangerő
- Zönge, zörej, F1, F2, F3, F4, hangerő
Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál?
- 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
- 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
- 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
- 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén?
- Folytonos
- Vonalas
- Elkent
- Felkent
Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez?
- 32
- 20
- 3
- 7
Mire jó a Gaussian Mixture Model (GMM)?
- Mindenre, amire a HMM is.
- Csak a HMM-mel kiegészítésben használható.
- Időillesztésre.
- Hasonlósági mérték számítására.
Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva?
- Hogy a magánhangzók érthetőbbek legyenek.
- Hogy ne legyen „huppogós” a beszéd.
- Hogy a zárhangok érthetőbbek legyenek.
- Hogy a réshangok érthetőbbek legyenek.
Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?
- 375 ms
- 280 ms
- 350 ms
- 325 ms
- 200 ms
- 240 ms
Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni?
- 180
- 200
- 256
- 25
Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva...
- 9 kHz körüli beszédkomponens biztosan kiszűrthető.
- átlapolódást (aliasing) kivédtük.
- A hangminőség a telefonosnál biztosan jobb lesz.
- Többnyire érthető, de zajos lesz a jel.
- Biztosan érthetetlen, használhatatlan lesz a kimenet.