Raw

A VIK Wikiből
A lap korábbi változatát látod, amilyen Csia Klaudia Kitti (vitalap | szerkesztései) 2021. december 3., 05:10-kor történt szerkesztése után volt.
Doesntmatter
Statisztika
Átlagteljesítmény
-
Eddigi kérdések
0
Kapott pontok
0
Alapbeállított pontozás
(+)
-
Beállítások
Minden kérdés látszik
-
Véletlenszerű sorrend
-
-


Melyik állítás(ok) igaz(ak)?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. Beszédre csak lineáris kvantálást használunk.
  2. LPC-10 kódoló csak a zöngés részt kódolja.
  3. MP3 kódolás veszteségmentesen visszaállítható beszéd esetén.
  4. A-törvényű kvantálás lineáris.
  5. A beszédkódolók minősége nem csak a bitsebességtől függ.
  6. Logaritmikus kvantálás veszteségmentesen visszaállítható.

Mely beszélőszerv(ek) szükséges(ek) zönge képzéshez?

Típus: több. Válasz: 1,5. Pontozás: -.

  1. Hangszalagok.
  2. Szájüreg.
  3. Orrüreg.
  4. Garat.
  5. Tüdő.
  6. Nyelv.

A "Novemberben havazott." mondatot szeretnénk elemösszefűzéses szövegolvasóval előállítani. Hány diád és/vagy CVC triád elem felhasználásával valósítható ez meg?

Típus: több. Válasz: 3,4. Pontozás: -.

  1. 7 triád.
  2. 15 diád.
  3. 19 diád.
  4. 5 diád + 7 triád.
  5. 10 diád + 10 triád.
  6. 3 diád + 8 triád.

Melyik koszinusz jelnek a legkisebb az intenzitása?

Típus: több. Válasz: 2. Pontozás: -.

  1. 7000Hz/65phon
  2. 1kHz/60 dB
  3. 1000Hz/61phon
  4. 20Hz/59phon
  5. 500Hz/120dB
  6. 18kHz/99dB

PSOLA eljárással módosítjuk a "túsz" szó alapfrekvenciáját 250 Hz-ről 200 Hz-re. A szó 100+100+100=300 ms hosszú. Mennyi lesz a módosított szó időtartama, ha az időváltozást nem kompenzáljuk?

Típus: több. Válasz: 4. Pontozás: -.

  1. 375 ms
  2. 280 ms
  3. 350 ms
  4. 325 ms
  5. 200 ms
  6. 240 ms

Egy beszédrészlet elemzésekor vonalas spektrumot látunk. Melyik állítás(ok) lehet(nek) biztosan igaz(ak)?

Típus: több. Válasz: 1. Pontozás: -.

  1. Magánhangzót látunk.
  2. Zajt látunk.
  3. Zöngétlen hangot látunk.
  4. Zárhangot látunk.
  5. Mássalhangzót látunk.
  6. Zöngés hangot látunk.

Egy 100Hz-es alapfrekvenciájú férfi beszélő esetén melyek NEM lehetnek az első két formáns értékei?

Típus: több. Válasz: 3. Pontozás: -.

  1. 1670 Hz
  2. 600 Hz
  3. 2980 Hz
  4. 500 Hz
  5. 550 Hz
  6. 100 Hz

Egy magánhangzó hangnyomás-idó függvényének amplitudóját egységesen felére csökkentjük számítógéppel. Hány dB-lel fog változni a hang intenzitása?

Típus: több. Válasz: 4. Pontozás: -.

  1. -1
  2. -2
  3. -6
  4. -3
  5. -4
  6. -5

Jelölje meg, hogy melyik hanghármasban van összetett szerkezetű beszédhang és ezzel egyidőben ugyanabban a hangban fojtott zönge!

Típus: több. Válasz: 1. Pontozás: -.

  1. egó
  2. lás
  3. sen
  4. átp
  5. csók
  6. rak

Milyen időközönként helyez el a PSOLA algoritmus zöngeszinkron jeleket az Én! hangsorban, ha azt egy nő ejti ki?

Típus: több. Válasz: 4. Pontozás: -.

  1. 200 ms
  2. 1 ms
  3. 100 μs
  4. 4 ms
  5. 40 ms
  6. 400 μs

Egy telefonos rendszerben n következő felharmonikusokat sikerül kimérnünk: 750 Hz, 1000 Hz, 1500 Hz. Mennyi lehet az alapfrekvencia?

Típus: több. Válasz: 5,6. Pontozás: -.

  1. 200 Hz
  2. 25 Hz
  3. 400 Hz
  4. 100 Hz
  5. 125 Hz
  6. 250 Hz

A magyar beszéd dallamformáira bemutatott modellben milyen frekvencián van a kijelentés végén az alapfrekvencia, ha a beszélő egy átlagos hangmagasságú nő?

Típus: több. Válasz: 2. Pontozás: -.

  1. kb. 140 Hz
  2. kb. 200 Hz
  3. kb. 70 Hz
  4. kb. 220 Hz
  5. kb. 320 Hz
  6. kb. 35 Hz

Milyen hosszú a következő mondat, ha egy átlagos beszédtempójú ember mondja ki? "A beszéd bonyolult jelenség, noha ezt nem érzékeljük, hisz mindannyian tudunk beszélni."

Típus: több. Válasz: 6. Pontozás: -.

  1. 5900 μs
  2. 900 ms
  3. 2500 μs
  4. 30 s
  5. 45 s
  6. 5800 ms

Melyik állítás(ok) igaz(ak) a PSOLA algoritmusra?

Típus: több. Válasz: 1,3. Pontozás: -.

  1. Módosíthatja a hangidőtartamot.
  2. MFCC paramétereket számolunk vele.
  3. Pitch Synchronous Overlap and Add-nek a rövidítése.
  4. Megszünteti a frekvenciaelfedés jelenségét.
  5. Módosítható vele a mintavételi frekvencia.
  6. Beszédfelismerésben használt.

Mi a WaveNet?

Típus: több. Válasz: 4. Pontozás: -.

  1. Egy HMM alapú hullámforma generáló rendszer.
  2. Egy beszédfelismerő rendszer.
  3. Beszéd alapú helymeghatározási megoldás.
  4. Egy mély neurális háló (DNN) alapú hullámforma generáló rendszer.
  5. Egy beszédátvitelt szabványosító szervezet.
  6. Ultrahangos beszédrögzítő készülék.

LPC analízisnél előállított maradéjelre mi jellemző?

Típus: több. Válasz: 3. Pontozás: -.

  1. Több biten kvantálható, mint az eredeti jel.
  2. Az a jel a maradékjel, ami nem fért bele az analízisablakba.
  3. LPC szintézis megvalósíható az eredeti maradékjel nélkül is.
  4. Eldobható, az eredeti jel enélkül is visszaállítható.
  5. Nagyobb az energiája az eredeti jelnél.
  6. Kinyerhető belőle a formánsfrekvencia értékek.

Melyik hang(ok) zöngétlen(ek)? (A hangokat közelítő betűképükkel jelöltük.)

Típus: több. Válasz: 6. Pontozás: -.

  1. g
  2. zs
  3. d
  4. dz
  5. z
  6. k

10 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: több. Válasz: 3. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5 méterről.
  2. Sugárhajtású repülő hajtóműve 15 méterről.
  3. Suttogó beszéd 10 méterről.
  4. Normál beszéd 1 méterről.
  5. Sírás 1 méterről.
  6. Kiabálás 15 méterről.

60 dB-es hangnyomásszintet mértünk. Mi lehetett a hangforrás?

Típus: több. Válasz: 4. Pontozás: -.

  1. Benzinmotoros fűnyíró 1,5 méterről.
  2. Sugárhajtású repülő hajtóműve 15 méterről.
  3. Suttogó beszéd 10 méterről.
  4. Normál beszéd 1 méterről.
  5. Sírás 1 méterről.
  6. Kiabálás 15 méterről.

Mi a Tacotron 2?

Típus: több. Válasz: 4. Pontozás: -.

  1. Egy HMM alapú hullámforma generáló rendszer.
  2. Egy beszédfelismerő rendszer.
  3. Beszéd alapú helymeghatározási megoldás.
  4. Egy mély neurális háló alapú hullámforma generáló rendszer.
  5. Egy beszédátvitelt szabványosító szervezet.
  6. Ultrahangos beszédrögzítő készülék.

Egy nyelv ábécéje 24 hangot (6 mgh, 18 msh) tartalmaz. Miminum hány diád és CVC triád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: több. Válasz: 6. Pontozás: -.

  1. 6^2+18^2
  2. 24^2+18*5^2
  3. 24^3
  4. 6*18*24
  5. 24^2
  6. 24^2+6*18^2

Folyamatos, nagyszótáras, beszélőfüggetlen beszédfelismerő betanításához készülő beszédadatbázist készítünk. Mi igaz ebben az esetben?

Típus: több. Válasz: 3,5. Pontozás: -.

  1. Csak CVC hangkapcsolatokat tartalmaz az adatbázis.
  2. Azonos életkorú beszélőkkel készítjük a felvételeket.
  3. Változatos körülmények (mikrofon, emberek) között rögzítjük a beszédadatbázist.
  4. Kevés jól megválasztott szó felolvasása is elegendő.
  5. Különböző korú és nemű emberrel is érdemes felvételt készíteni. Sok beszélő szükséges.
  6. Csak studió körülmények között felvett beszédet lehet használni.

Nagyságrendileg hány felharmonikus komponens van egy férfi által előállított normálisan ejtett zöngehangban a 2000 Hz-es frekvenciáig?

Típus: több. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Egy nyelv ábécéje 26 hangot (7 mgh, 19 msh) tartalmaz. Miminum hány diád elem kell a nyelv minden hangkapcsolatának lefedéséhez?

Típus: több. Válasz: 5. Pontozás: -.

  1. 7^2+19^2
  2. 26^2+19*7^2
  3. 26^3
  4. 7*19*26
  5. 26^2
  6. 26^2+7*19^2

Milyen intenzitással hallgatható zene tartósan és élvezhetően, halláskárosodás nélkül?

Típus: több. Válasz: 1. Pontozás: -.

  1. 76-80 dBA
  2. 800 dBA
  3. 0 dBA
  4. 18 dBA
  5. -18 dBA
  6. 138 dBA
  7. 8 dBA

Melyik frekvenciatartományban legintenzívebb az 'ő' hang spektruma?

Típus: több. Válasz: 5. Pontozás: -.

  1. 20Hz-30Hz
  2. 20kHZ-30kHz
  3. 10Hz-20Hz
  4. 15khZ-20kHz
  5. 50Hz-5kHz
  6. 5kHz-10kHz

A "képpont" szó átlagos köznyelvi kiejtésében a "p" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 3. Pontozás: -.

  1. A "p" hang nem változik meg szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú hang a "p" hang.
  5. A "p" hang megváltozik szó közepén a rövid verzióhoz képest.
  6. Folytott zönge legalább 100 ms lesz.

Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 4000 Hz-es frekvenciáig?

Típus: több. Válasz: 2. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Mi a jellemző a formánsokra?

Típus: több. Válasz: 1,3,4,6. Pontozás: -.

  1. Nem csak az F0 egész számú többszöröse lehet.
  2. Értékük független a beszélő nemétől.
  3. Az F2 meghatározza a mgh hangrendjét.
  4. Az alapfrekvenciánál nagyobb az értékük.
  5. A mghzóknak 1440 db formánsa van.
  6. A hang spektrumából meghatározható.

Nagyságrendileg hány felharmonikus komponens van egy nő által előállított normálisan ejtett zöngehangban a 1600 Hz-es frekvenciáig?

Típus: több. Válasz: 5. Pontozás: -.

  1. 40
  2. 20
  3. 100
  4. 200
  5. 8
  6. 4

Melyik frekvenciatartományban legintenzívebb az 'sz' hang spektruma?

Típus: több. Válasz: 4. Pontozás: -.

  1. 20Hz-30Hz
  2. 20kHZ-30kHz
  3. 10Hz-20Hz
  4. 3khZ-10kHz
  5. 50Hz-5kHz
  6. 5kHz-10kHz

A "kéttannyelvű" szó átlagos köznyelvi kiejtésben a "t" hangra milyen tulajdonságok jellemzőek?

Típus: több. Válasz: 4. Pontozás: -.

  1. A "t" hang nem változik meg szó közepén a rövid verzióhoz képest.
  2. Nagy energiájú hang lesz.
  3. Felpattanás a hang elejére kerül.
  4. Több mint 100 ms hosszú hang a "t" hang.
  5. A némafázisa nem hosszabb, mint 100 μs.
  6. Folytott zönge legalább 100 ms lesz.

Beszédet tömörítünk LPC-10 kódolóval: ehhez az F0 értékeket 10 biten, a maradékjel energiáját és az LP együtthatókat 10-10 biten tároljuk 25ms-os szegmensenként. Mekkora lesz a bitsebesség?

Típus: több. Válasz: 3. Pontozás: -.

  1. 10000 bps
  2. 480 bps
  3. 4800 bps
  4. 1000 bps
  5. 48 bps
  6. 10 bps

Mi a jellemző a μ-law kódolásra?

Típus: több. Válasz: 5. Pontozás: -.

  1. HMM beszédfelismerés előfeldolgozója.
  2. μ meredekségű lineáris kvantálás.
  3. Négyzetes kvantálású.
  4. 8 bites lineáris kvantálás.
  5. Nagy amplitudú esetén ritkább a kvantálás.
  6. MFCC paraméterei.

Mi jellemző a "p" hangra?

Típus: több. Válasz: 2. Pontozás: -.

  1. Zöngés.
  2. Zárhang.
  3. Felpattanás a hang elején található.
  4. F2 értéke magas.
  5. Nazális.
  6. Folytott zöngét tartalmaz.

Melyik állítás igaz az alábbiakból a dinamikus idővetemítésre (DTW)?

Típus: több. Válasz: 5. Pontozás: -.

  1. Két egymásnak megfelelő összesített bemondás összehasonlítására szolgál kizárólagosan, azaz vagy az "alma" és "alma" vagy a "körte" és "körte" bemondáspárok hasonlósága számítható, de ezek nem keverhetőek.
  2. A beszéd gépi generálásánál a természetesen beszédritmikát állítja elő.
  3. Az einsteini általános relativitás elméletnek megfelelően a gyorsabban beszélők számára lassabban telik az idő.
  4. Ha már tudjuk, mi a helyes beszédfelismerési eredmény, csak akkor használható az időbeli illesztés elvégzésére.
  5. Két tetszőleges hangszakasz közötti összesített távolságminimum meghatározására szolgál, azaz pl. az "alma" és "körte" bemondások hasonlósága számítható.
  6. .

160 kHz-en mintavételezek 8 kHz-es ideális alul áteresztő szűrővel egy beszédjelet. Mi lesz a jellel?

Típus: több. Válasz: 6. Pontozás: -.

  1. Érthetetlen lesz az átlapolódás miatt.
  2. Csak a mássalhangzók maradnak meg.
  3. Veszteségmentesen tárolható.
  4. Alig érthető marad a beszéd.
  5. Csak az alapfrekvencia marad meg.
  6. Majdnem tökéletesen megmarad a beszéd.

Egy telefonos jelnél 2400 Hz-es F2-őt mértünk. Mennyi az F0?

Típus: több. Válasz: . Pontozás: -.

  1. 2400 Hz.
  2. 12 Hz.
  3. 600 Hz.
  4. 120 Hz.
  5. 1200 Hz.
  6. Nem tudjuk megállapítani.

Milyen hosszú egy szó, amely egy diád, 2 triád és még egy diádból áll. A szüneteket nem számoljuk.

Típus: több. Válasz: 4. Pontozás: -.

  1. 4 hang.
  2. 6 hang.
  3. 9 hang.
  4. 5 hang.
  5. 12 hang.
  6. 8 hang.