„ZH felkészítést segítő kvíz” változatai közötti eltérés
A VIK Wikiből
58. sor: | 58. sor: | ||
# 7 triád | # 7 triád | ||
# 15 diád | # 15 diád | ||
# | # 20 diád | ||
# | # 6 diád + 7 triád | ||
# 10 diád + 10 triád | # 10 diád + 10 triád | ||
# 3 diád + 8 triád | # 3 diád + 8 triád |
A lap 2023. november 16., 19:10-kori változata
10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?
- Benzinmotoros fűnyíró 1,5m-ről.
- Normál beszéd 1m-ről.
- Sugárhajtású repülő hajtóműve 15m-ről.
- Suttogó beszéd 10m-ről.
- Elhaladó vonat 2m-ről.
- Erős közúti forgalom 1m-ről.
16 kHz-en mintavételezek 8 kHz-es ideális aluláteresztő szűrővel egy beszédjelet. Mi lesz a jellel?
- Érthetetlen lesz az átlapolódás miatt.
- Csak a mássalhangzók maradnak meg.
- Veszteségmentesen tárolható.
- Alig érhető marad a beszéd.
- Csak az alapfrekvencia marad meg.
- Majdnem tökéletesen megmarad a beszéd.
20 dB hangnyomászintet mértünk. Mi lehetett a forrás?
- Sírás 1 m-ről
- Fűnyíró 2 m-ről
- Kiabálás 3 m-ről
- Suttogás 0,5 m-ről
3,1 kHz-es szinuszjelet anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-2300Hz sávszűrő van. Mi lesz a kimenő jel?
- 1,9 kHz szinusz
- 3,1 kHz szinusz
- 1,7 kHz szinusz
- 1,9 és 2,9 kHz szinusz
60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?
- Benzinmotoros fűnyíró 1,5m-ről.
- Normál beszéd 1m-ről.
- Sugárhajtású gép hajtóműve 5 m-ről.
- Sugárhajtású repülő hajtóműve 15m-ről.
- Suttogó beszéd 10m-ről.
- Elhaladó vonat 2m-ről.
- Erős közúti forgalom 1m-ről.
- Haladó kamion 2 m-ről.
- Papírlap susogása 1 m-ről.
A "Kimegyünk?" mondat melyik hangjában a legnagyobb az alapfrekvencia?
- Első k
- N
- E
- I
- Ü
A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegefelolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?
- 7 triád
- 15 diád
- 20 diád
- 6 diád + 7 triád
- 10 diád + 10 triád
- 3 diád + 8 triád
A "képpont" szó átlagos köznyelvi kiejtésben a "p" hangra milyen tulajdonságok jellemzőek?
- A "p" hang megváltozik a szó közepén a rövid verzióhoz képest.
- Nagy energiájú hang lesz.
- Felpattanás a hang elejére kerül.
- Több mint 100 ms hosszú a "p" hang.
- A némafázisa nem hosszabb mint 100 μs.
- Fojtott zönge legalább 100 ms lesz.
A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?
- A "t" hang nem változik meg a szó közepén a rövid verzióhoz képest.
- Nagy energiájú hang lesz.
- Felpattanás a hang elejére kerül.
- Több mint 100 ms hosszú a "t" hang.
- A némafázisa nem hosszabb mint 100 μs.
- Fojtott zönge legalább 100 ms lesz.
A Viterbi-algoritmus…
- A GMM paraméterek gyors közelítő számítására használható.
- A HMM paraméterek gyors közelítő számítására használható.
- Adja meg a beszédfelismerésnél a helyes eredményt.
- A HMM legjobb illeszkedésű útvonalát mindig megtalálja.
A felharmonikusok definíció szerint…
- Megegyeznek a formánsok középfrekvenciáival.
- Az alapfrekvencia egész számú többszörösei.
- A rezonátorüreg által felerősített felhangnyalábok.
- Az alapfrekvencia páratlan, egészszámú többszörösei.
A felharmonikusok és az alapfrekvencia között milyen összefüggés van?
- Az alapfrekvenciát a felharmonikusokkal maradék nélkül tudjuk osztani.
- A felharmonikusok az alapfrekvencia egész számú többszörösei.
- A felharmonikusok az alapfrekvenciának mindig a kétszerese.
- Az alapfrekvencia (mely 100 vagy 200 Hz), 3-mal szorozva kapjuk meg az első felharmonikust.
A formáns paramétereket milyen modell alapján lehet beszédszintézisre használni?
- Forrás-szűrő.
- Jel-szűrő.
- Frekvencia-szűrő.
- Intenzitás-szűrő.
A hangkapcsolatok spektrális illeszkedése mely beszédhangokban lényeges az egymás után fűzött elemeknél?
- C-k
- V-k
- Nazálisok
- Zárhangok
A kvantálás(t)...
- Lépésköze függ a mintavételi frekvenciától.
- Lépésköze nem függ a mintavételi frekvenciától.
- Veszteségmentesen visszaállítható.
- Lépésköze nem befolyásolja a hangminőséget.
- Csak egyenletes közökkel használják beszédre.
- Függ a beszéd alapfrekvenciájától.
A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?
- Kb. 135 Hz
- Kb. 320 Hz
- Kb. 65 Hz
- Kb. 200 Hz
- Kb. 220 Hz
- Kb. 35 Hz
- Kb. 140 Hz
- Kb. 70 Hz
A rejtett Markov modelleket (HMM)...
- Minden esetben helyettesíthetjük Markov láncokkal.
- A Viterbi-algoritmussal taníthatjuk be.
- A GMM-ekkel együtt lehet beszédfelismerésre használni.
- Csak a GMM-mel kiegészítésben használhatjuk bármi is.
A súrlódási zörej időtartama szerint hallott hangok alapján egy affrikáta:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A súrlódási zörej időtartama szerint hallott hangok alapján egy réshang:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A súrlódási zörej időtartama szerint hallott hangok alapján egy zárhang:
- T < 50 ms
- T = 50 ms
- 50 < t < 100 ms
- 100 ms < t
A “hasát” szóban milyen hang található?
- Pergő rész
- Nazális
- Réshang
- Zöngés zárhang
A “sás” szót kiejtve milyen rész található a beszédjelben?
- Pergő rész
- Nazális
- Zöngés rész
- Zöngés zárhang
A „Hajókázunk?” kérdő mondat melyik hangjában a legmagasabb az alapfrekvencia?
- á
- Záró „k”
- U
- A
A „baba” szóból hogyan lehet hangsebészettel papa szót készíteni?
- A b felpattanás elé szünetet kell beiktatni.
- A zöngés zár + a felpattanás részt is cserélni kell egy másik minta alapján.
- A b előtti zár szakaszt csendre kell cserélni.
- Nem megvalósítható.
Adja meg egy beszédadatbázis elkészítési műveletsorának lépéseit Korpuszos beszédszintetizátorhoz!
- Szöveg gyűjtése.
- Hang felvétele mester mondattal.
- Szótagokra vágás.
- Fonetikai átirat és hanghatár bejelölése minden mondatra.
Az alábbi fogalompárok közül melyik kapcsolható közvetlenül beszédadatbázisok feldolgozásához?
- Annotálás és szegmentálás.
- Szupraszegmentálás és koartikuláció.
- Koartikuláció és annotálás.
- Egyik sem.
Az alábbi hangok közül melyiknél fordul elő fojtott zönge képzése?
- Sz
- K
- T
- D
- A
Az alábbiak közül melyik segít a beszédhangok határainak jelölésében?
- Spektogram.
- Intenzitás-idő függvény.
- Felvétel meghallgatása.
- Mindegyik segít benne.
Az annotálás...
- A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy fix gyűjtési szempont szerinti hanganyag tartalmaz.
- A hangfelvétel tartalmával kapcsolatos általános információkat adunk meg, melyeket egy címkefájl tartalmaz.
- A kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
- A kérdéses részek összekapcsolása jelzésekkel a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25 ms-os szegmensenként. Mekkora lesz a bitsebesség?
- 10 000 bsp
- 480 bps
- 4800 bps
- 1000 bps
- 48 bps
- 48 000 bps
Egy 100 Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?
- 1670 Hz
- 600 Hz
- 2980 Hz
- 500 Hz
- 550 Hz
- 100 Hz
Egy 3 kHz-es szinuszt szűrés nélkül mintavételezünk 5 kHz-en. Mi lesz a mintavételezett jel?
- 0,5 kHz-es szinuszjel.
- 2 kHz-es szinuszjel.
- 3 kHz-es szinuszjel.
- 1 kHz-es szinuszjel.
Egy 3,1 kHz-es szinuszt anti-alias szűrés nélkül mintavételezünk 4,8 kHz-en. A kimeneten 100-3400 Hz sávszűrő. Mi lesz a kimenő jel?
- 3,1 kHz-es szinuszjel.
- 1,7 kHz-es szinuszjel.
- 3 kHz-es szinuszjel.
- 1,7 és 3,1 kHz-es szinuszjel.
Egy 60 dB intenzitású hangforrást megkettőzünk. Mennyi lesz az eredő intenzitás?
- 120 dB
- 63 dB
- 60 dB
- 90 dB
Egy 7 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?
- 8 kHZ-en
- 4 kHz-en
- 3,5 kHz-en
- 7 kHz-en
- 1 kHz-en
- Sehol, mert kiszűrésre kerül.
Egy 9 kHz-es szinusz jelet szűrés nélkül mintavételezünk 16 kHz-en. A mintavett jelben hol jelenik meg a bemeneti szinusz jel?
- 8 kHZ-en
- 4 kHz-en
- 3,5 kHz-en
- 7 kHz-en
- 1 kHz-en
- Sehol, mert kiszűrésre kerül.
Egy akusztikus jellemzővektor…
- Egy adott hosszúságú hangrészletet jellemez.
- Egy teljes bemondást jellemez.
- Egy teljes hangot jellemez.
- Egy teljes szót jellemez.
Egy beszédhullám nyomás-amplitúdóját felezzük. Ez dB-ben mennyi növekedést jelent?
- 6 dB
- -6 dB
- 3 dB
- -3 dB
Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?
- Magánhangzót látunk.
- Zajt látunk.
- Zöngétlen hangot látunk.
- Zárhangot látunk.
- Mássalhangzót látunk.
- Zöngés hangot látunk.
Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 1 kHz alatt nincs komponens. Miért lehet ez? (*)
- Fojtott zöngét látunk.
- Egy réshang részletét látjuk.
- Túl kvantálási szint van.
- A zaj kimaszkolta a jelet.
- MP3 kódolás hibája.
- Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
Egy beszédrészlet spektogrammját látjuk, aminek egy szakaszán 3 kHz alatt nincs komponens. Miért lehet ez? (*)
- MP3 kódolás.
- Egy réshang részletét látjuk.
- Fojtott zöngét látunk.
- A zaj kimaszkolta a jelet.
- Hibás frekvenciája vagy nincs bemeneti szűrő a mintavételnél.
- Mivel női beszélő esetén nincs a beszédnek itt frekvenciakomponense.
Egy beszédszintetizáló rendszerhez milyen adatbázist érdemes használni?
- Profi bemondó, változatos hanganyag.
- Több beszélő, szavak felolvasása.
- Egy bemondó, egy hang kitartása.
- Egyik sem.
Egy magánhangzó hangnyomás-idő függvényének amplitúdóját egységesen felére csökkenti a számítógéppel. Hány dB-lel fog változni a hang intenzitása?
- -1
- -2
- -6
- -3
- -4
- -5
Egy másodperces beszéd mennyi helyet foglal 22kHz mintavételezés és 16 bites tömörítetlen tárolás esetén?
- 44 bájt
- 22 kbájt
- 44 kbájt
- 88 kbájt
Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 16 bites tömörítetlen tárolás esetén?
- 88 Byte
- 44 kByte
- 176 kByte
- 88 kByte
Egy másodpercnyi beszéd mennyi helyet foglal 44 kHz, 23 bites tömörítetlen tárolás esetén?
- 88 Byte
- 44 kByte
- 88 kByte
- 132 kByte
Egy nyelv ábécéje 24 hangot (6 magánhangzó és 18 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?
- 6 * 6 + 18 * 18
- 24 * 24 + 18 * 5 * 5
- 24 * 24 * 24
- 6 * 18 * 24
- 24 * 24
- 24 * 24 + 6 * 18 * 18
Egy nyelv ábécéje 26 hangot (7 magánhangzó és 19 mássalhangzó) tartalmaz. Minimum hány diád kell a nyelv minden hangkapcsolatának lefedéséhez?
- 7 * 19 * 26
- 19 * 19 * 19 + 7 * 7 * 7
- 26 * 26
- 26 * 26 + 7 * 19 * 19
- 26 * 26 + 26 * 26 * 26
- 26 * 26 * 26
Egy nyelv ábécéje 36 hangot (10 magánhangzó és 26 mássalhangzó) tartalmaz. Minimum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?
- 26 * 26 * 26 + 10 * 10 * 10
- 36 * 36 + 26 * 10 * 10
- 36 * 36 + 10 * 26 * 26
- 36 * 36 * 36
- 36 * 36
- 10 * 10 + 26 * 26
Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?
- 2400 Hz
- 200 kHz
- 12 Hz
- 120 Hz
- 25 Hz
- Nem tudjuk megállapítani.
Egy telefonos rendszerben a következő felharmonikusokat sikerült kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?
- 200 Hz
- 25 Hz
- 400 Hz
- 100 Hz
- 125 Hz
- 250 Hz
Egy átlagos női beszélőnél hány zöngeperiódius mérhető meg egy hosszabb mondat "milyen" szavában?
- 1000
- 5
- 13
- 200
- 16 000
- 80
Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?
- Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
- Azonos életkorú beszélőkkel készítjük a felvételeket.
- Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
- Kevés jól megválasztott szó felolvasása is elegendő.
- Különböző korú és nemű emberrel is érdemes felvételt készíteni
- Csak studió körülmények között felvett beszédet lehet használni.
Férfi bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája: „Holnap érkezem.”
- 10 Hz
- 100 Hz
- 20 Hz
- 70 Hz
Hogy hívják az egyenlő hangosság érzetű görbét?
- Phon
- Phön
- Schön
- Decibel
Hogy viszonyulnak a formánsok középfrekvenciái a zöngeképzés során létrejövő alapfrekvenciákhoz?
- Személyfüggő kapcsolat van.
- Függetlenek tőle.
- Az alapfrekvencia egészszámú többszöröseinél vannak.
- Az alapfrekvencia páratlan egészszámú többszöröseinél vannak.
Hogyan lehet a kasza szóból kata szót készíteni hangsebészettel?
- Sehogy
- Az sz hang első 90%-át csendre kell cserélni
- Az sz hang első felének amplitúdóját nullára kell állítani
- Az sz hang helyére fojtott zöngét kell egy másik bemondásból beállítani
- Az sz hangot ki kell vágni
Hogyan nevezzük a hangszalagok rezgése által keltett, a gégefőben létrejövő gerjesztőjelet?
- Zönge
- Zengő
- Vokál
- Spektrál
- Surlódási zörej
Hogyan nevezzük a zöngés jel spektruma burkolójának csúcsait?
- Felharmonikus
- Alapfrekvencia
- Formáns
- Oktáv
Hogyan változik meg egy felpattanó zárhang nyújtáskor?
- Az energiája megnő.
- Megismétlődik a felpattanó rész.
- Zárrész megnyúlik.
- Megnő az alapfrekvenciája.
Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 48 dB?
- 8 bites
- 12 bites
- 4 bites
- 16 bites
Hány bites a lineáris kvantáló, ha a max kivezérlésű jel és a kvantálási zaj viszonya 72 dB?
- 8 bites
- 12 bites
- 4 bites
- 16 bites
Hány bites a lineáris kvantáló, ha a maximális kivezérlésű jel és a kvantálási zaj viszonya 96 dB?
- 4 bites
- 8 bites
- 16 bites
- 32 bites
Hány fajta diád kellhet egy magyar nyelvű gépi szövegfelolvasó működtetéséhez?
- 1600
- 10 000
- 256
- 64
- 39 * 39 * 39
- 25 + 14
- 39 * 39
- 25 * 25 * 14 + 25 * 25
Hány felharmonikus mérhető 4000 Hz-ig 200 Hz alapfrekvencia mellett?
- 19
- 20
- 15
- 40
Hány hullámforma elemmel készíthető ember szerű gépi számfelolvasó 1 milliárdig?
- 1000
- 9
- 25
- 250
Hány hullámforma elemmel készíthető ember szerű gépi telefonszám-felolvasó magyar nyelvre? Pl: +36-30-123-4567?
- 1000
- 9
- 25
- 250
Igaz vagy hamis? A szegmentálás a kérdéses részek elkülönítése jelzésekkel/eseményhatárokkal a beszéd időfüggvényében, ahol a gyűjtési szempont szerinti jellemzés a hanganyagban megváltozik.
- Igaz
- Hamis
Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge?
- Egó
- Lás
- Sen
- átp
- Csók
- Rak
LPC analízisnél előállított maradékjelre mi jellemző?
- Kinyerhetők belőle a formánsfrekvencia értékek.
- Több biten kvantálható, mint az eredeti jel.
- Az a jel a maradékjel, ami nem fért bele az analízisablakba.
- LPC szintézis megvalósítható az eredeti maradékjel nélkül is.
- Eldobható az eredeti jel enélkül is visszaállítható.
- Nagyobb az energiája az eredeti jelnél.
Legalább hány beszédhangot definiáljunk egy magyar diádos szövegfelolvasó fejlesztéséhez?
- 168
- 10
- 40
- 2
Mekkora amplitúdócsökkenés mérhető az ajkakról kisugárzott "á" hang esetén?
- 6 dB/oktáv
- 12 db/oktáv
- 0 dB/oktáv
- -3 dB/oktáv
Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?
- Hangszalagok
- Szájüreg
- Orrüreg
- Garat
- Tüdő
- Nyelv
Mely hang(ok) zöngétlen(ek)?
- D
- Cs
- L
- Dz
- V
- G
- Zs
- Z
- K
Mely állítás(ok) igaz(ak) a kvantálási zajra?
- Csak 6 bit alatti kvantálásnál létezik.
- Értéke nem meghatározható, mert a használt mikrofontól függ.
- Függ a mintavételi frekvenciától.
- Csak logaritmikus kvantálásnál jelentkezik.
- Függ a kvantálási lépcsők számától.
- Lineáris kvantálásnál is létezik.
Melyik TTS technológia használ beszédkódolót a szintetizált hullámforma előállításához?
- HMM statisztikai TTS.
- WaveNet TTS.
- Kempelen gépe.
- Diád alapú hullámforma.
Melyik hang(ok)nak van periodikus szakasza?
- L
- M
- Sz
- F
- S
- H
- J
- Ny
Melyik hangnak a legmagasabb az F2 értéke?
- I
- A
- U
- E
Melyik hangnak a legnagyobb az F1 értéke?
- I
- á
- ő
- U
- ú
Melyik komponenseit érdemes megtartani az amplitudóspektrumnak, ha az ablak hossza 256 minta?
- Az első 226 komponensét.
- Az első 128 komponensét.
- Az első 256 komponensét.
- Az első 512 komponensét.
Melyik koszinusz jelnek a legkisebb az intenzitása?
- 7000 Hz / 65 phon
- 1 kHz / 60 db
- 1000 Hz/ 61 phon
- 20 Hz / 59 phon
- 500 Hz / 120 dB
- 18 kHz / 99 dB
Melyik mai módszerhez áll legközelebb a Bánó Miklós tetszőleges szöveg reprodukálására alkalmas beszélőgépe?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
Melyik mai módszerhez áll legközelebb a Kempelen Farkas beszédkeltő gépe?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszéddetektáló rendszer.
Melyik módszert alkalmazná egy jó minőségű gépi hang előállításához, ha kevés hanganyag áll rendelkezésre, korábbi bemondó meg nem elérhető, továbbfejlesztett rendszernek hasonló hangúnak kell lennie?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszédhang adaptáló rendszer (HMM alapú adaptálásos TTS).
Melyik módszert alkalmazná egy kellemes női hang pályaudvaron használandó utastájékoztató rendszerhez?
- Korpusz alapú elem összefűzős rendszer.
- Diád építőelemes beszédszintetizáló rendszer.
- Formás szintézis.
- Beszéddetektáló rendszer.
Melyik nem játszik közvetlen szerepet a hallásban?
- Eustach-kürt
- Kalapács
- Patkó
- Dobhártya
- Kasza
- Üllő
Melyik szinusz jelet halljuk a leghangosabbnak?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik szinusz jelnek a legnagyobb az intenzitása?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik szinusz jelnek legkisebb az intenzitása?
- 40 Hz-es 45 dB
- 1 kHz-es 50 dB
- 2 kHz-es 49 dB
- 10 kHz-es 51 dB
Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?
- Két, egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
- A beszéd gépi generálásánál a természetes beszédritmikát állítja elő.
- Az einsteini általános relativitás elméletének megfelelően a gyorsabb beszélők számára lassabban telik az idő.
- Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
- Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. Az "alma" és a "körte" bemondások hasonlósága számítható.
Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?
- Módosíthatja a hangidőtartamot.
- MFCC paramétereket számolunk vele.
- Pitch Synchronous Overlap and Add-nek a rövidítése.
- Megszünteti a frekvenciaelfedés jelenséget.
- Módosítható vele a mintavételi frekvencia.
- Beszédfelismerésben használt.
Melyik állítás(ok) igaz(ak)?
- Beszédre csak lineáris kvantálást használunk.
- LPC-10 kódoló csak a zöngés részt kódolja.
- MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
- A-törvényű (A-law) kvantálás lineáris.
- A beszédkódolók minősége nem csak a bitsebességtől függ.
- Logaritmikus kvantálás veszteségmentesen visszaállítható.
Melyiket halljuk a leghangosabbnak?
- 1kHz-en 40 dB
- 2kHz-en 30 dB
- 500 Hz-en 50 phon
- 20 Hz-en 80 dB
Melyiket használjuk az alábbiak közül betű-hang átalakításra?
- PAMPA
- SAMPA
- PUMPA
- SAMBA
- IPAK
Mennyi a magyar magánhangzók formánsainak jellemző frekvencia tartománya?
- 20 – 20 000 Hz
- 30 – 3400 Hz
- 6000 – 10 000 Hz
- 300 – 4000 Hz
- 1000 – 7000 Hz
Mi NEM része a halló szervrendszerünknek?
- Nyereg
- Kalapács
- Kengyel
- üllő
Mi a Tacotron 2?
- Egy beszédátvitelt szabványosító szervezet.
- Egy mély neurálisháló alapú rendszer.
- Beszédalapú helymeghatározási megoldás.
- Egy beszédfelismerő eszköz.
- Egy HMM alapú hullámforma generáló rendszer.
- End-to-end rendszer.
Mi a WaveGlow?
- Egy beszédátvitelt szabványosító szervezet.
- Egy mély neurálisháló alapú rendszer.
- Beszédalapú helymeghatározási megoldás.
- Egy folyamat alapú beszédgeneráló rendszer.
- Egy HMM alapú hullámforma generáló rendszer.
- End-to-end rendszer.
Mi a WaveNet?
- Ultrahangos beszédrögzítő készülék.
- Egy beszédátvitelt szabványosító szervezet.
- Egy hullámforma generáló rendszer, amely gépi tanuláson alapul.
- Beszéd alapú helymeghatározási megoldás.
- Egy DNN alapú hullámforma generáló rendszer.
- Egy HMM alapú hullámforma generáló rendszer.
- Egy mély neurális háló alapú hullámforma generáló rendszer.
Mi a formáns definíciója?
- A hangszalagoknál kialakult zönge periódusideje.
- A hangképző üreg által felerősített felhangnyaláb.
- Az alapfrekvencia egész számú többszörösei.
- A 2. és 3. Felharmonikus.
Mi a hangnyomás mértékegysége?
Mi a hangnyomásszinttel kifejezett decibelben szereplő szorzótényező?
- 20
- 10
- 15
- 50
Mi az akusztikai dB mértékegysége?
- W/m2
- N/m2
- M/s2
- Mértékegység nélküli.
Mi hangnyomás mértékegysége?
- W/m2
- N/m2
- M/s2
- Mértékegység nélküli.
Mi idézhet elő átlapolódást (aliasing) a digitálisan feldolgozott beszédjelben?
- A jel tulajdonságaihoz képest alacsony mintavételi frekvencia.
- A jel tulajdonságaihoz képest alacsony bitmélységű kvantálás.
- Lineáris predikciós kódolás.
- Erős háttérzaj a beszéd felvétele közben.
- A jel tulajdonságaihoz képest túl magas mintavételi frekvencia.
- A bemeneti aluláteresztő szűrő hiánya.
Mi igaz az F0, F1, F2 értékekre?
- F1 és F2 gyakorlatilag független F0-tól.
- F1 kétszerese az F0 értéknek. F2 háromszorosa F0 értékének.
- F0-t Hz-ben, F1-et és F2-őt meg dB-ben mérjük.
- F0 a nulladik formáns, F1 az első, F2 pedig a második.
Mi jellemző a "p" hangra?
- Zöngés.
- Zárhang.
- Felpattanás a hang elején található.
- F2 értéke magas.
- Nazális.
- Fojtott zöngét tartalmaz.
Mi jellemző a formánsokra?
- A néma fázisoknál is megmérhető.
- Értékük független a beszélő nemétől.
- Az F2 meghatározza a magánhangzó hangrendjét.
- Az alapfrekvenciánál nagyobb az értékük.
- A magánhangzóknak 1440 db formánsa van.
- Vonalas spektrum esetén nem meghatározható.
- Női beszélőknél jellemzően alacsonyabb értékeket vesz fel.
- Nem csak az F0 egész számú többszöröse lehet.
- A magánhangzók 1140 db formánsa van.
- A hang spektrumából meghatározható.
- Nem függ a beszédhangtól.
Mi jellemző a μ-law kódolásra?
- A HMM beszédfelismerés előfeldolgozója.
- μ meredekségű lineáris kvantálás.
- Négyzetes kvantálású.
- 8 bites lineáris kvantálás.
- Nagy amplitúdó esetén ritkább a kvantálás.
- MFCC paraméterei.
Mi történik tipikusan egy kijelentő mondat végén lévő zöngés hanggal?
- Alapfrekvenciája alacsonyabb lesz, mint a mondat kezdetén.
- Alapfrekvenciája magasabb lesz, mint a mondat kezdetén.
- A zöngés hang zöngétlenedik.
- A zöngés hang felhangosodik.
Miben különbözik egy mondat kiejtése, ha kérdőjel van a végén, vagy ha pont?
- Más lesz a felharmonikusok menete a mondat közepén.
- Más az alapfrekvencia menete.
- Változatlan marad.
- Formánsok megváltoznak.
Miben tér el a 'b' hang a 'p' hang akusztikai megjelenésétől?
- A 'p' zöngétlen hang, a 'b' zöngés.
- Csak a ’p’-nek vannak zajkomponensei.
- A ’b’ időben összetett szerkezetű, a ’p’ nem.
- Csak a zajkomponensek frekvenciahelyei térnek el.
Mik a jellemzők a HMM alapú beszédhang adaptálásos TTS rendszerre?
- Szép, természetes hangzás.
- Biztosítja a hanszínezet megtartását új hanfelvételnél.
- Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
- Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
Mik a jellemzők a Korpusz alapú elem összefűzős rendszerre?
- Szép, természetes hangzás.
- Biztosítja a hanszínezet megtartását új hanfelvételnél.
- Nagy szakértelmet kíván mind az elkészítéshez, mind a működtetéshez.
- Minden hangkapcsolódást jó akusztikai formában elő tud állítani.
Milyen alapon tervezzük meg a prozódiai modellt egy kötött szótáras beszédszintetizátornál?
- Jel-idő függvény alapon.
- LPC alapú TTS-en.
- Időtengely alapon.
- Frekvencia-jel függvény alapon.
Milyen aluláteresztő szűrő és mintavételi frekvencia kell a “sóstó” szó torzításmentes átviteléhez?
- 5 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
- 9 kHz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
- 18 kHz-es ideális szűrő, 9 kHz-es mintavételi frekvencia.
- 9 kHz-es ideális szűrő, 4.5 kHz-es mintavételi frekvencia.
Milyen elvű TTS-ben működik jellemzően szabály alapú prozódia megvalósítás?
- HMM alapú statisztikai parametrikus TTS.
- Diád alapú hullámforma összefűzéses TTS.
- LPC alapú TTS.
- Kempelen beszélő gépe.
Milyen frekvenciatartományban legintenzívebb az "sz" hang spektruma?
- 20 Hz - 30 Hz
- 20 kHz - 30 kHz
- 10 Hz - 20 Hz
- 3 kHz - 10 kHz
- 50 Hz - 5 kHz
- 5 kHz - 10 kHz
Milyen frekvenciatartományban legintenzívebb az "ő" hang spektruma?
- 20 Hz - 30 Hz
- 20 kHz - 30 kHz
- 10 Hz - 20 Hz
- 15 kHz - 20 kHz
- 50 Hz - 5 kHz
- 5 kHz - 10 kHz
Milyen hang NINCS a HASÁN szóban?
- Nazális hang
- Réshang
- Magánhangzó
- összetett hang
- Zöngés hang
Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljuk, hiszen mindannyian tudunk beszélni."
- 5900 μs
- 900 ms
- 2500 μs
- 30 s
- 45 s
- 5800 ms
Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd egy bonyolult jelenség."
- 1800 μs
- 45 s
- 30 s
- 900 ms
- 2000 ms
- 5800 μs
Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll? A szüneteket nem számoljuk.
- 4 hang
- 9 hang
- 3 hang
- 6 hang
- 5 hang
- 10 hang
Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! Hangsorban, ha azt egy nő ejti ki?
- 200 ms
- 1 ms
- 100 μs
- 4 ms
- 40 ms
- 400 μs
Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?
- 78 dBA
- 800 dBA
- 18 dBA
- 138 dBA
- 8 dBA
- -18 dBA
Milyen mintavételi frekvencia kell a „szekerce” szóhoz, hogy a szó hangjai jól érthetőek legyenek?
- 16 kHz
- 8 kHz
- 1 kHz
- 2 kHz
Milyen paraméterek kellenek egy formáns alapú beszédszintetizátor vezérléséhez?
- F0, F1, F2, F3
- B1, B2, B3, F0, F1, F2, F3
- Zönge, zörej, F0, F1, F2, F3, hangerő
- Zönge, zörej, F1, F2, F3, F4, hangerő
Milyen paramétereket használnak a formánsokhoz definiált formánssávszélességhez? (Formánssávszélesség = a rezonenciafrekvencia-görbe maximumától visszaszámolt –3 dB-es pontok közötti frekvenciatávolság)
- F0, F1, F2, F3
- B1, B2, B3, B4, B5
- Zönge, zörej, F0, F1, F2, F3, hangerő
- Zönge, zörej, F1, F2, F3, F4, hangerő
Milyen sáváteresztő szűrő és mintavételi frekvencia kell a "sósmogyoró" szó kiváló minőségű átviteléhez női bemondásnál?
- 50 - 5000 Hz-es ideális szűrő, 22 Hz-es mintavételi frekvencia
- 0 - 22 kHz-es ideális szűrő, 40 kHz-es mintavételi frekvencia
- 50 - 9000 Hz-es ideális szűrő, 22 kHz-es mintavételi frekvencia
- 1 - 11 kHz-es ideális szűrő, 22 kHz-es mintavételi frekvencia
Milyen sáváteresztő szűrő és mintavételi frekvencia kell a „hószóró” szó kiváló minőségű átviteléhez férfi bemondásnál?
- 10 – 10 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
- 90 – 9 000 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
- 50 – 50 000 Hz-es ideális szűrő, 10 kHz-es mintavételi frekvencia.
- 0,9 – 90 00 Hz-es ideális szűrő, 18 kHz-es mintavételi frekvencia.
Milyen típusú spektrumot figyelhetünk meg zöngés gerjesztésű hangok esetén?
- Folytonos
- Vonalas
- Elkent
- Felkent
Minimum hány fajta paraméter kell egy formáns alapú beszédszintetizátor vezérléséhez?
- 32
- 20
- 3
- 7
Mire jó a Gaussian Mixture Model (GMM)?
- Mindenre, amire a HMM is.
- Csak a HMM-mel kiegészítésben használható.
- Időillesztésre.
- Hasonlósági mérték számítására.
Miért fontos, hogy a hangok egymáshoz viszonyított intenzitása helyesen legyen beállítva?
- Hogy a magánhangzók érthetőbbek legyenek.
- Hogy ne legyen „huppogós” a beszéd.
- Hogy a zárhangok érthetőbbek legyenek.
- Hogy a réshangok érthetőbbek legyenek.
Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?
- 40
- 20
- 100
- 200
- 8
- 4
Női bemondás esetén mennyi lehet az utolsó magánhangzó alapfrekvenciája a "Holnap este mozizunk." mondatban?
- 70 Hz
- 100 Hz
- 160 Hz
- 550 Hz
- 2 kHz
PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100 + 100 + 100 = 300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?
- 375 ms
- 280 ms
- 350 ms
- 325 ms
- 200 ms
- 240 ms
Számfelolvasóhoz hány elemet készítünk, ha 1 milliárdig kell bármilyen számot felolvasni?
- 180
- 200
- 256
- 25
Átalpolódásmentesítő szűrő nélkül 10 kHz-en mintavételezve a beszédjelet, majd a 4,5 kHz-es aluláteresztővel visszaállítva...
- 9 kHz körüli beszédkomponens biztosan kiszűrthető.
- átlapolódást (aliasing) kivédtük.
- A hangminőség a telefonosnál biztosan jobb lesz.
- Többnyire érthető, de zajos lesz a jel.
- Biztosan érthetetlen, használhatatlan lesz a kimenet.