<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="hu">
	<id>https://vik.wiki/index.php?action=history&amp;feed=atom&amp;title=2007_j%C3%BAnius_15-i_vizsga_megold%C3%A1sa</id>
	<title>2007 június 15-i vizsga megoldása - Laptörténet</title>
	<link rel="self" type="application/atom+xml" href="https://vik.wiki/index.php?action=history&amp;feed=atom&amp;title=2007_j%C3%BAnius_15-i_vizsga_megold%C3%A1sa"/>
	<link rel="alternate" type="text/html" href="https://vik.wiki/index.php?title=2007_j%C3%BAnius_15-i_vizsga_megold%C3%A1sa&amp;action=history"/>
	<updated>2026-05-01T09:34:54Z</updated>
	<subtitle>Az oldal laptörténete a wikiben</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://vik.wiki/index.php?title=2007_j%C3%BAnius_15-i_vizsga_megold%C3%A1sa&amp;diff=137084&amp;oldid=prev</id>
		<title>Unknown user: Új oldal, tartalma: „{{GlobalTemplate|Infoalap|BeszedVizsga20070615Megoldas}}   Feladatsor: a lap alján csatolva, vagy az infosite-on: [http://info.sch.bme.hu/document.php?cmd=download_pro…”</title>
		<link rel="alternate" type="text/html" href="https://vik.wiki/index.php?title=2007_j%C3%BAnius_15-i_vizsga_megold%C3%A1sa&amp;diff=137084&amp;oldid=prev"/>
		<updated>2012-10-21T19:54:15Z</updated>

		<summary type="html">&lt;p&gt;Új oldal, tartalma: „{{GlobalTemplate|Infoalap|BeszedVizsga20070615Megoldas}}   Feladatsor: a lap alján csatolva, vagy az infosite-on: [http://info.sch.bme.hu/document.php?cmd=download_pro…”&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Új lap&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{GlobalTemplate|Infoalap|BeszedVizsga20070615Megoldas}}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Feladatsor: a lap alján csatolva, vagy az infosite-on: [http://info.sch.bme.hu/document.php?cmd=download_proc&amp;amp;tmp_page=&amp;amp;doc_id=18031 [[InfoSite]] - 2007 június 15.] (A Csoport)&lt;br /&gt;
&lt;br /&gt;
==1. feladat==&lt;br /&gt;
	 {{InLineImageLink|Infoalap|BeszedVizsga20070615Megoldas|feladat1-beszed070615.png}}&lt;br /&gt;
&lt;br /&gt;
# PCM: Pulse Code Modulation (logaritmikus), ezen belül van az A-law (EU) és &amp;lt;math&amp;gt;\mu&amp;lt;/math&amp;gt;-law (USA). Lineáris kvantálás. LPC - lineáris predikció. MPEG (layer 3).&lt;br /&gt;
# Szabályalapú, statisztikai alapú (HMM - Hidden Markov Model és ANN - Artificial Neuro Network ) illetve sablon alapú (DTW).&lt;br /&gt;
# Mindenhol, ahol hang- ill. beszédátvitel történik, így mobilhálózat, telefonvonal, VoIP, stb.&lt;br /&gt;
# Azt az értéket adja meg, hogy mennyi annak a valószínűsége, hogy egy HMM rendszer x állapotában j jellemzővektort figyeljünk meg.&lt;br /&gt;
# Az akusztikus modell az egyes beszédhangokra ad egy referencia-jellemzővektorokat, míg a nyelvi modell a beszédhangok kombinációs lehetőségeit adja meg szótárak segítségével, illetve akár a ragozáshoz nyújt megfelelő szabálybázist.&lt;br /&gt;
&lt;br /&gt;
==2. feladat==&lt;br /&gt;
	 {{InLineImageLink|Infoalap|BeszedVizsga20070615Megoldas|2.Feladat-beszed070615.png}}&lt;br /&gt;
&lt;br /&gt;
El tudjuk dönteni. Mivel HMM-ről van szó, és a mintaillesztéshez feltétel hogy a START állapotból a STOP állapotba jussunk el úgy, hogy eközben lépések (állapotváltások) és megfigyelések váltogassák egymást, könnyen látható hogy a középső szó (rekesze) kiesik, hiszen 6 állapotot tartalmaz, míg nekünk 5 megfigyelési vektorunk van, így ezen az úton nem juthatunk el a STOPig. Másrészt megfigyelhető hogy a rekesz ill. repesz szónál is minden állapotváltás valószínűsége rendre megegyezik, sőt egyetlen állapotban, a középsőben különböznek (k vs p). Ebből triviálisan adódik hogy az egyetlen különbséget a két út valószínűsége között az adja, hogy mekkora a kérdéses középső állapotban a 3. jellemzővektor megfigyelése, minden más valószínűségi szorzótényezőben (állapotváltások és megfigyelések: mindig rendre ugyanazt kell megfigyelni ugyanabban az állapotban) megegyeznek.&lt;br /&gt;
&lt;br /&gt;
Mivel p állapotban &amp;lt;math&amp;gt;o_3&amp;lt;/math&amp;gt; megfigyelése 0.8, és t állapotban csak 0.2, a &amp;quot;repesz&amp;quot; szó lesz a felismert szó.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
És mivel az elején sem egyformák a valószínűségek, azt is bele kéne venni... 0.3*0.2 vs. 0.2*0.8 de így is repesz. -- [[KovacsAdam|Csádám]] - 2010.12.14.&lt;br /&gt;
&lt;br /&gt;
==3. feladat==&lt;br /&gt;
	 {{InLineImageLink|Infoalap|BeszedVizsga20070615Megoldas|feladat3-beszed070615.png}}&lt;br /&gt;
# Annotálás: címkézés, azaz a megfelelően szegmentált időintervallumokat ellátjuk a megfelelő magyarázatokkal: milyen hangról van szó, hangsúlyos-e, zöngés-e, stb. A szegmentálás pedig a hanganyag időfüggvényén a hanghatárok bejelölését jelenti.&lt;br /&gt;
# Nincs táblázatom, ezért a lényeg: ennél a feladatnál a különböző hangváltásokra kell odafigyelni (hasonulások, összeolvadások, rövidülések és kivetések). Ennek a szövegnek esetében konkrétan: &lt;br /&gt;
** elmondtam --&amp;gt; elmontam, a d hang kiesik!&lt;br /&gt;
** havadtői --&amp;gt; havattői, részleges hasonulás, zöngétlenesedés.&lt;br /&gt;
** közben --&amp;gt; köszben, részleges hasonulás, zöngétlenesedés. (kétségeim vannak, &amp;quot;hasonulás&amp;quot; helyett éppen hogy különbözővé válna)&lt;br /&gt;
** azt --&amp;gt; aszt, részleges hasonulás, zöngétlenesedés.&lt;br /&gt;
** csöppség --&amp;gt; csöpség, rövidülés&lt;br /&gt;
** megfogta --&amp;gt; megfokta, részleges hasonulás, zöngétlenesedés.&lt;br /&gt;
** kilyukadt --&amp;gt; kilyukatt, részleges hasonulás, zöngétlenesedés.&lt;br /&gt;
** másegyéb?&lt;br /&gt;
** odahívta --&amp;gt; odahífta: részleges has., zöngétlenedés&lt;br /&gt;
(Írásban nem jelölt) teljes hasonulásra példa: anyja --&amp;gt; annya, hagyja --&amp;gt; haggya&lt;br /&gt;
másik irányban működő: község --&amp;gt; kösség, tizennyolc&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==4. feladat==&lt;br /&gt;
A hangszalagrezgést elektroglottográf segítségével (10KHz-es, 16 bites lineáris mintavételezéssel) rögzítjük, majd visszajátsszuk.&lt;br /&gt;
A beszélő a következő szöveget mondta: &amp;quot;Eljössz velem? Nem megyek. Nem? Bárcsak eljönnél, úgy szeretném!&amp;quot;&lt;br /&gt;
(Volt ZH kérdés is - 2009 ősz)&lt;br /&gt;
&lt;br /&gt;
a)Milyen beszédjellemzőket lehet meghallani egy ilyen hangszalagrezgésről készített hangfelvételből ami biztosan az elhangzott beszédhez tartozik? Legalább hármat soroljon fel.&lt;br /&gt;
&lt;br /&gt;
	A következő beszédjellemzőket lehet meghallani: a beszélő neme (F0 frekvenciájából). A mondatok típusa nagyjából (prozódiából, azaz alaphang-változásokból kifolyólag). Ugyanebből kitalálhatók a hangsúlyok helyei is. Beszéddallam. Emellett a zöngés / zöngétlen hangok határait is nagyjából el lehet találni. Gond a CC és VV kapcsolatoknál van.&lt;br /&gt;
&lt;br /&gt;
b) Hallható-e a beszéd szegmentális elemei közül valamelyik? Ha igen, akkor melyik(ek). Ha nem, akkor miért nem?&lt;br /&gt;
	Szegmentális szint: a hangok specifikus időtartamai nagyjából kiolvashatók (?), de nem konkrét hang(kapcsolatok)ra, hanem csak általánosan.&lt;br /&gt;
&lt;br /&gt;
c) Hallható-e a beszéd szupraszegmentális elemei közül valamelyik? Ha igen, akkor melyik(ek). Ha nem, akkor miért nem?&lt;br /&gt;
&lt;br /&gt;
	Szupraszegmentális szinten: beszéddallam, hangsúlyok, esetleg ritmus, tempó.&lt;br /&gt;
&lt;br /&gt;
d) Lejegyezhető-e a beszélő személy által mondott szöveg?&lt;br /&gt;
	Nem. Rengeteg információ hiányzik, kb csak annyi állapítható meg hogy magánhangzó vagy mássalhangzót ejt az illető, de még ezek határa is nehezen meghatározható.&lt;br /&gt;
&lt;br /&gt;
e) Megállapítható-e a beszélő személy neme egy ilyen hangfelvételből?&lt;br /&gt;
	Igen. Az alapfrekvencia megfigyelhető, és ebből következtethetünk a nemére is.&lt;br /&gt;
&lt;br /&gt;
f) Rajzolja le a periodikus hangszalagrezgés spektrális képét.&lt;br /&gt;
	A hangszalagrezgés képe: van egy alapfrekvencia (x Hz, ahol x 100-300 között van), ami a spektrumban egy vonal. Ennek felharmonikusai, azaz többszörösei (n*x Hz) is megjelennek a spektrumban, de egyre kisebb amplitudóval. A csökkenés -12 dB felharmonikusonként. Lásd a képet: &lt;br /&gt;
&lt;br /&gt;
{{InLineImageLink|Infoalap|BeszedVizsga20070615Megoldas|hangszalaggerjesztes.JPG}}&lt;br /&gt;
&lt;br /&gt;
==5. feladat==&lt;br /&gt;
	 {{InLineImageLink|Infoalap|BeszedVizsga20070615Megoldas|feldatat5-beszed070615.png}}&lt;br /&gt;
&lt;br /&gt;
# Érthetetlen lesz, hiszen rengeteg fontos frekvencia ill. formáns van a 1000-2000 Hz-es tartományban, pl a magánhangzók második formánsának jórésze bele esik ebbe a tartományba. Valami mély mormogást hallunk, gyanítom. (Egyéb, pontosabb ötlet?)&lt;br /&gt;
# Jel/Zaj viszony: SNR=1,74+n*6,02=1,74*16*6,02=98,06&lt;br /&gt;
# A beszéd dallama nem sérül, hiszen ezt az alapfrekvencia adja meg (F0), aminek a mozgását a hangterjedelem adja meg. Ez pedig tipikusan 100-400Hz közötti érték, amit a szűrő még átvisz.&lt;br /&gt;
&lt;br /&gt;
==6. feladat ==&lt;br /&gt;
Egy triádos adatbázisú, hullámforma-összefűzéses szintetizátorral a következő mondatot állítjuk elő: &amp;quot;Miért 40% a határ?&amp;quot;. &lt;br /&gt;
Írja le milyen feldolgozási lépések valósulnak meg a példamondaton, amíg a szövegből a végleges hullámforma előáll! &lt;br /&gt;
(Volt ZH kérdés is - 2009 ősz)&lt;br /&gt;
&lt;br /&gt;
* Első lépés: begyűjtés! helyett Graféma-&amp;gt;Graféma konverziók, avagy a különféle jelölések feloldása, hogy csak betű legyen az output, mégpedig: &amp;quot;Miért negyven százalék a határ?&amp;quot;&lt;br /&gt;
* Graféma-&amp;gt;Fonéma konverziók avagy a g és y nem külön g és y hanem &amp;quot;gy&amp;quot;. Karakterek helyett beszédhangokat írunk. Ezt valami SAMPA átírással lehetne jól leírni.&lt;br /&gt;
* Fonéma-&amp;gt;Fonéma konverziók avagy nem negyven-nek ejtjük ezt a szót így, hanem netyven-nek. Hasonulások, összeolvadások, rövidülések, kivetések. Eredmény (SAMPA-ban lenne ildomos írni): Mi(j)ért netyven százalék a határ?&lt;br /&gt;
* Mindezekkel párhuzamosan fontos a prozódia mondatszintű, szószintű stb lebontása, relatív megadása. Ugyanígy intenzitással is. Amennyire lehetséges, hangsúlyhatárokat is bejelöljük (pl vessző előtt felmegy).&lt;br /&gt;
* Ha mindez megvan, egy adatmátrixot kapunk, melyben a szöveg minden lényeges elemét hangokra lebontva megadtuk, ami a kiejtéshez kell. Ezek főbb vonalakban: frázishatárok, szünetek, hangsúly, időtartam, F0, F0 töréspont, intenzitás. Utóbbi 4-et %-ban célszerű megadni.&lt;br /&gt;
* Ezt az adatmátrixot kapja meg a triádos beszédgenerátor.&lt;br /&gt;
* A beszédgenerátor veszi a hangkódokat a jelölésnek megfelelően. CVC helyzetbe triádot keres, egyéb helyzetekben pedig diádot. &lt;br /&gt;
* Ezek hangosságát, frekvenciaszerkezetét és periódusidejét megváltoztatja a megadott százalékoknak stb. megfelelően.&lt;br /&gt;
* A szükséges helyekre megfelelő nagyságú szünetet illeszt be.&lt;br /&gt;
* Az egyes elemeket simító algoritmusokkal összefűzi.&lt;br /&gt;
* Utolsó lépés: a profit! :)&lt;br /&gt;
&lt;br /&gt;
-- [[RendesGaborAntal|Gabo]] - 2008.05.28.&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:Infoalap]]&lt;/div&gt;</summary>
		<author><name>Unknown user</name></author>
	</entry>
</feed>