Beszédinformációs rendszerek 2010. november 11. ZH

A VIK Wikiből
A nyomtatható változat már nem támogatott, és hibásan jelenhet meg. Kérjük, frissítsd a böngésződ könyvjelzőit, és használd a böngésző alapértelmezett nyomtatás funkcióját.

Ez az oldal a korábbi SCH wikiről lett áthozva.

Ha úgy érzed, hogy bármilyen formázási vagy tartalmi probléma van vele, akkor, kérlek, javíts rajta egy rövid szerkesztéssel!

Ha nem tudod, hogyan indulj el, olvasd el a migrálási útmutatót.



1.- Jellemezze a saját nevének kiejtett formáját beszédképzési és akusztikai szempontból!

a) Osztályozza a nevének hangjait külön-külön legalább 3 beszédhang-osztályozási forma szerint.

???

b) Rajzolja fel a kiejtett név hangnyomásváltozására jellemző közelitő intenzitás-idő függvényét. Jelölje benne a hanghatárokat is. Időosztás: 100ms=kb. 2cm

c) Adja meg e nevében szereplő magánhangzók artikulációjára jellemző paramétereket mindegyik V-re.

  • MGH:
    • ajakrés/kerekítés
    • nyelvállás alapján:
      • legalsó, alsó, középső, felső
      • első, hátsó
    • állkapocs nyitószög:
      • nyílt, félig nyílt, félig zárt zárt

d) Adja meg a nevében szereplő C-k egyértelmű definiálását a tanult 3 paraméter segitségével mindegyik C-re.

  • MSG:
    • gerjesztés: Zöngés, zöngétlen, kevert
    • artikuláció módja szerint: zár, rés, zár-rés, nazális, l,j,r
    • képzés helye szerint: két ajak (b p m), ajakfog (v f), fog (d t c z sz n dz), fogmeder (cs dzs zs s l r), első szájpadlás (gy ty j), hátsó szájpadlás (g k ny), gége (h)

e) Mennyi lehet egy átlagos hangmagasság frekvencia értéke, ha Ön ejti ki a saját nevét? Indokoljon!

magánhangzók formánsai alapján. Talán.


2.- Elemezze az alábbi szonogrammon látható értelmes magyar szót!

Húzza be a beszédhangok határait! Jellemezze a beszédhangok sajátosságait a tanultak alapján! Próbálja meghatározni a hangsort! Indokoljon! Minden hangra adja meg a gerjesztés tipusát (részletesen) és helyét! Női, férfi vagy gyermek beszéde van a spektogrammon? Magyarázza meg a döntését!


3.- Mi lehet az oka annak, hogy egy német nyelvű, 50 hangot tartalmazó beszédszintézis hangadatbázis egy felvétel alapján 4 különböző változatban, 7Mb, 3.5Mb, 2.54Mb és 1.27Mb méretben is elkészült?

4.- Adja meg a következő fogalmak és röviditések jelentését és válaszoljon a feltett kérdésekre!

a) Mi a formánsok és az F0 kapcsolata?

  • Formánsok az F0 páratlan számú többszörösei

b) Mi a teljesitmény sűrűség spektrum, az akkusztikai dB és a Phon érték kapcsolata?

c) Mi a zabla, a kengyel, az üllő és a kalapács kapcsolata a beszédinformációs rendszerekkel?

  • fülben vannak :) kivéve a zabla. Mert az a lovakhoz való.

d) Mi a "Hanning ablak" és a "szonogram" kapcsolata?

  • Hanning ablak: ablakozó függvény, aminek ilyen alakja van, és két eszméletlen gusztustalan racionális számmal kell leírni
  • a(t) = 0.54 - 0.46*cos(2PI*t/Ta)

5.- Egy ismeretlen mindtavételi frekvenciával és Pam tipusú, H(f) karakterisztikájú simitó visszaállitóval működő mintavtelező rendszer bemenetére váltakozva kerül beszédjel és zongoraszóló. A kimeneten a beszédhang hibátlanul szól, viszont a zongoraszóló hangzása nagyon torz.

a) Adja meg a rendszer ismeretlen jellemzőit, amelyek mellett ez a kimenet előállhatott! (több jó megoldás is lehet)

b) Javasoljon olyan megoldást, amely az eredeti jelet hyelesen és elfogadható komplexitással megvalósitva átviszi!

6.- Egy triádos adatbázisú, hullámforma-összefűzéses szintetizátorral a következő mondatot állitjuk elő: „Miért pont 10cm?”. Irja le milyen jelfeldolgozási lépések valósulnak meg a példamondaton amig a szövegből a végleges hullámforma előáll!

-- Liba - 2010.12.02.