<?xml version="1.0"?>
<feed xmlns="http://www.w3.org/2005/Atom" xml:lang="hu">
	<id>https://vik.wiki/index.php?action=history&amp;feed=atom&amp;title=Besz%C3%A9d%C3%9CberChart</id>
	<title>BeszédÜberChart - Laptörténet</title>
	<link rel="self" type="application/atom+xml" href="https://vik.wiki/index.php?action=history&amp;feed=atom&amp;title=Besz%C3%A9d%C3%9CberChart"/>
	<link rel="alternate" type="text/html" href="https://vik.wiki/index.php?title=Besz%C3%A9d%C3%9CberChart&amp;action=history"/>
	<updated>2026-05-17T14:15:07Z</updated>
	<subtitle>Az oldal laptörténete a wikiben</subtitle>
	<generator>MediaWiki 1.43.8</generator>
	<entry>
		<id>https://vik.wiki/index.php?title=Besz%C3%A9d%C3%9CberChart&amp;diff=175626&amp;oldid=prev</id>
		<title>Kory, 2014. január 18., 14:39-n</title>
		<link rel="alternate" type="text/html" href="https://vik.wiki/index.php?title=Besz%C3%A9d%C3%9CberChart&amp;diff=175626&amp;oldid=prev"/>
		<updated>2014-01-18T14:39:20Z</updated>

		<summary type="html">&lt;p&gt;&lt;/p&gt;
&lt;table style=&quot;background-color: #fff; color: #202122;&quot; data-mw=&quot;interface&quot;&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;col class=&quot;diff-marker&quot; /&gt;
				&lt;col class=&quot;diff-content&quot; /&gt;
				&lt;tr class=&quot;diff-title&quot; lang=&quot;hu&quot;&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;← Régebbi változat&lt;/td&gt;
				&lt;td colspan=&quot;2&quot; style=&quot;background-color: #fff; color: #202122; text-align: center;&quot;&gt;A lap 2014. január 18., 16:39-kori változata&lt;/td&gt;
				&lt;/tr&gt;&lt;tr&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot; id=&quot;mw-diff-left-l1&quot;&gt;1. sor:&lt;/td&gt;
&lt;td colspan=&quot;2&quot; class=&quot;diff-lineno&quot;&gt;1. sor:&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;{{GlobalTemplate|Infoalap|BeszedUberPuska}}&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot; data-marker=&quot;−&quot;&gt;&lt;/td&gt;&lt;td style=&quot;color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #ffe49c; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;&lt;del style=&quot;font-weight: bold; text-decoration: none;&quot;&gt;&lt;/del&gt;&lt;/div&gt;&lt;/td&gt;&lt;td colspan=&quot;2&quot; class=&quot;diff-side-added&quot;&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Mivel se az infositeon se a wikin nem volt egy táblázat fontos adatokról, létrehoztunk egyet. Bővítsétek, mert nektek is jó!&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Mivel se az infositeon se a wikin nem volt egy táblázat fontos adatokról, létrehoztunk egyet. Bővítsétek, mert nektek is jó!&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;tr&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Pecc, Neu&lt;/div&gt;&lt;/td&gt;&lt;td class=&quot;diff-marker&quot;&gt;&lt;/td&gt;&lt;td style=&quot;background-color: #f8f9fa; color: #202122; font-size: 88%; border-style: solid; border-width: 1px 1px 1px 4px; border-radius: 0.33em; border-color: #eaecf0; vertical-align: top; white-space: pre-wrap;&quot;&gt;&lt;div&gt;Pecc, Neu&lt;/div&gt;&lt;/td&gt;&lt;/tr&gt;
&lt;/table&gt;</summary>
		<author><name>Kory</name></author>
	</entry>
	<entry>
		<id>https://vik.wiki/index.php?title=Besz%C3%A9d%C3%9CberChart&amp;diff=137072&amp;oldid=prev</id>
		<title>Unknown user: Új oldal, tartalma: „{{GlobalTemplate|Infoalap|BeszedUberPuska}}   Mivel se az infositeon se a wikin nem volt egy táblázat fontos adatokról, létrehoztunk egyet. Bővítsétek, mert nekt…”</title>
		<link rel="alternate" type="text/html" href="https://vik.wiki/index.php?title=Besz%C3%A9d%C3%9CberChart&amp;diff=137072&amp;oldid=prev"/>
		<updated>2012-10-21T19:54:02Z</updated>

		<summary type="html">&lt;p&gt;Új oldal, tartalma: „{{GlobalTemplate|Infoalap|BeszedUberPuska}}   Mivel se az infositeon se a wikin nem volt egy táblázat fontos adatokról, létrehoztunk egyet. Bővítsétek, mert nekt…”&lt;/p&gt;
&lt;p&gt;&lt;b&gt;Új lap&lt;/b&gt;&lt;/p&gt;&lt;div&gt;{{GlobalTemplate|Infoalap|BeszedUberPuska}}&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
Mivel se az infositeon se a wikin nem volt egy táblázat fontos adatokról, létrehoztunk egyet. Bővítsétek, mert nektek is jó!&lt;br /&gt;
Pecc, Neu&lt;br /&gt;
&lt;br /&gt;
__TOC__&lt;br /&gt;
&lt;br /&gt;
==Hangok osztályozása gerjesztés szerint==&lt;br /&gt;
&lt;br /&gt;
* zöngés: az összes magánhangzó, b, d, g, gy, v, j, m, n, ny, l, r&lt;br /&gt;
* zörejes: p, t, ty, k, c, cs, f, sz, s, j*, h&lt;br /&gt;
* kevert: dz, dzs, z, zs&lt;br /&gt;
&lt;br /&gt;
==Hangok osztályozása szerkezet szerint==&lt;br /&gt;
&lt;br /&gt;
* Egyszerű: az összes magánhangzó, v, f, z, sz, zs, s, j, h, m, n, l&lt;br /&gt;
* Összetett: b, p, d, t, g, k, gy, ty, c, cs, dz, dzs, ny, r&lt;br /&gt;
&lt;br /&gt;
==Hangok osztályozása illeszkedésük szerint==&lt;br /&gt;
&lt;br /&gt;
* Stabil: gy, ty, j, n, ny, r&lt;br /&gt;
* Kölcsönösen illeszkedő: b,p, d, t, dz, c, dzs, cs, v, f, z, sz, zs, s, h, m, l, az összes magánhangzó (?)&lt;br /&gt;
* Erősen illeszkedő: g, k&lt;br /&gt;
&lt;br /&gt;
==Osztályozás vizuálisoknak==&lt;br /&gt;
&lt;br /&gt;
https://wiki.sch.bme.hu/pub/Infoalap/BeszedUberPuska/besz_hang_osztalyozas.jpg&lt;br /&gt;
&lt;br /&gt;
==Mássalhangzók osztályozása hangképzés szerint==&lt;br /&gt;
&lt;br /&gt;
* Nazális: m, n, ny, ng&lt;br /&gt;
* Likvida: l, j&lt;br /&gt;
* Pergő: r&lt;br /&gt;
* Felpattanó zárhang: t,d,p,b,k,g,ty,gy&lt;br /&gt;
* Réshang: f,v,s,zs,sz,z,h&lt;br /&gt;
* Zár-réshang (affrikáta): c,cs,dz,dzs&lt;br /&gt;
&lt;br /&gt;
==Magánhangzók formánsai==&lt;br /&gt;
&lt;br /&gt;
(A CD-ről kimásolva)&lt;br /&gt;
&lt;br /&gt;
https://wiki.sch.bme.hu/pub/Infoalap/BeszedUberPuska/mgh_F1_F2.png&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Mássalhangzók formánsai, zörejgócai==&lt;br /&gt;
&lt;br /&gt;
(A CD-ről kimásolva)&lt;br /&gt;
&lt;br /&gt;
https://wiki.sch.bme.hu/pub/Infoalap/BeszedUberPuska/msh_F_Z.png&lt;br /&gt;
&lt;br /&gt;
==Gépi beszédfelismerők jellemzése==&lt;br /&gt;
Mo&amp;amp;#779;ko&amp;amp;#776;de&amp;amp;#769;si elv: &lt;br /&gt;
* Szaba&amp;amp;#769;lyba&amp;amp;#769;zisu&amp;amp;#769;&lt;br /&gt;
* Statisztikai alapu&amp;amp;#769;: HMM, ANN &lt;br /&gt;
* Sablon alapu&amp;amp;#769;: DTW (Dynamic Time Warping)&lt;br /&gt;
&lt;br /&gt;
Haszna&amp;amp;#769;lat mo&amp;amp;#769;dja: &lt;br /&gt;
* Sponta&amp;amp;#769;n besze&amp;amp;#769;d (folyamatos besze&amp;amp;#769;d, pl dikta&amp;amp;#769;lo&amp;amp;#769; rendszerek)&lt;br /&gt;
* Parancsmo&amp;amp;#769;du&amp;amp;#769; veze&amp;amp;#769;rle&amp;amp;#769;s (izola&amp;amp;#769;lt szavas) &lt;br /&gt;
* Dialo&amp;amp;#769;gusveze&amp;amp;#769;rle&amp;amp;#769;s (kapcsolt szavas, a szavak ko&amp;amp;#776;zo&amp;amp;#776;tti szu&amp;amp;#776;netek minima&amp;amp;#769;lisak)&lt;br /&gt;
Me&amp;amp;#769;ret: &lt;br /&gt;
* Kicsi: pa&amp;amp;#769;rsza&amp;amp;#769;z szo&amp;amp;#769;&lt;br /&gt;
* Ko&amp;amp;#776;zepes &lt;br /&gt;
* Nagy: 20-80 ezer szo&lt;br /&gt;
&lt;br /&gt;
==Besze&amp;amp;#769;dfelismerő rendszereket minősitési szempontok==&lt;br /&gt;
* statisztikai alapu&amp;amp;#769; (HMM, ANN) vagy szaba&amp;amp;#769;lyba&amp;amp;#769;zis/tuda&amp;amp;#769;salapu&amp;amp;#769; &lt;br /&gt;
* besze&amp;amp;#769;l&amp;amp;#305;fu&amp;amp;#776;ggetlen, besze&amp;amp;#769;l&amp;amp;#305;fu&amp;amp;#776;gg&amp;amp;#305; vagy adapti&amp;amp;#769;v (avagy besze&amp;amp;#769;l&amp;amp;#305;k sza&amp;amp;#769;ma alapja&amp;amp;#769;n)&lt;br /&gt;
* akusztikus ko&amp;amp;#776;rnyezet alapja&amp;amp;#769;n: robusztus (zajos ko&amp;amp;#776;rnyezetben is haszna&amp;amp;#769;lhato&amp;amp;#769;), ta&amp;amp;#769;vbesze&amp;amp;#769;l&amp;amp;#305; min&amp;amp;#305;se&amp;amp;#769;ggel vagy kiva&amp;amp;#769;lo&amp;amp;#769; hangmin&amp;amp;#305;se&amp;amp;#769;ggel mo&amp;amp;#779;ko&amp;amp;#776;dik csak &lt;br /&gt;
* szociolingvisztika: dialektusra, korra e&amp;amp;#769;s nemre e&amp;amp;#769;rze&amp;amp;#769;keny e &lt;br /&gt;
* artikula&amp;amp;#769;cio&amp;amp;#769; alapja&amp;amp;#769;n: izola&amp;amp;#769;lt szavas, kapcsolt szavas vagy folytonos (dikta&amp;amp;#769;lo&amp;amp;#769;) rendszer &lt;br /&gt;
* szo&amp;amp;#769;ta&amp;amp;#769;rme&amp;amp;#769;ret: kis (&amp;lt;100 szo&amp;amp;#769;), ko&amp;amp;#776;zepes vagy nagy (&amp;gt;20.000 szo&amp;amp;#769;) &lt;br /&gt;
* besze&amp;amp;#769;dsti&amp;amp;#769;lus: sponta&amp;amp;#769;n, parancsmo&amp;amp;#769;du&amp;amp;#769; vagy dialo&amp;amp;#769;gus-menu&amp;amp;#776;szero&amp;amp;#779; &lt;br /&gt;
* nyelvfu&amp;amp;#776;gge&amp;amp;#769;s-nyelvazonosi&amp;amp;#769;ta&amp;amp;#769;s &lt;br /&gt;
* alkalmazo&amp;amp;#769;i ko&amp;amp;#776;rnyezet: szakembereknek vagy laikusoknak, egyfelhaszna&amp;amp;#769;lo&amp;amp;#769;s vagy sokfelhaszna&amp;amp;#769;lo&amp;amp;#769;s&lt;br /&gt;
&lt;br /&gt;
==Prozódia==&lt;br /&gt;
&lt;br /&gt;
A prozo&amp;amp;#769;dia a besze&amp;amp;#769;ddallam, a hangsu&amp;amp;#769;ly, a ritmus, a hangero, a tempo&amp;amp;#769; e&amp;amp;#769;s a hangszi&amp;amp;#769;nezet nyelvi haszna&amp;amp;#769;lata, a besze&amp;amp;#769;dke&amp;amp;#769;pze&amp;amp;#769;s szupraszegmenta&amp;amp;#769;lis szintje&amp;amp;#769;nek re&amp;amp;#769;sze. [forra&amp;amp;#769;s: Besze&amp;amp;#769;d CD, 7.oldal] &lt;br /&gt;
&lt;br /&gt;
&amp;#039;&amp;#039;&amp;#039;Komponensei:&amp;#039;&amp;#039;&amp;#039;&lt;br /&gt;
* Dallam &lt;br /&gt;
* Hangsu&amp;amp;#769;ly (ezen belu&amp;amp;#776;l alkomponensek: alapfrekvencia, intenzita&amp;amp;#769;s, id&amp;amp;#305;tartam) &lt;br /&gt;
* Ritmus &lt;br /&gt;
* Hangszi&amp;amp;#769;n (?)&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
==Jellemző beszédfrekvenciák==&lt;br /&gt;
&lt;br /&gt;
A folyamatos beszéd átlagos F0 alapfrekvenciái [Hz]:&lt;br /&gt;
&lt;br /&gt;
* férfiaknál: 100-200&lt;br /&gt;
* nőknél: 150-300&lt;br /&gt;
* gyerekeknél: 250-600&lt;br /&gt;
&lt;br /&gt;
forrás: beszedakusztika_gyak_2005.pdf&lt;br /&gt;
&lt;br /&gt;
==Triádos megoldósdi==&lt;br /&gt;
&lt;br /&gt;
Egy triádos adatbázisú, hullámforma-összefűzéses szintetizátorral a következő mondatot állítjuk elő: &amp;quot;Miért 40% a határ?&amp;quot;. Írja le milyen feldolgozási lépések valósulnak meg a példamondaton, amíg a szövegből a végleges hullámforma előáll! (Volt ZH kérdés is - 2009 ősz) &lt;br /&gt;
&lt;br /&gt;
* Első lépés: Graféma-&amp;gt;Graféma konverziók, avagy a különféle jelölések feloldása, hogy csak betű legyen az output, mégpedig: &amp;quot;Miért negyven százalék a határ?&amp;quot;&lt;br /&gt;
&lt;br /&gt;
* Graféma-&amp;gt;Fonéma konverziók avagy a g és y nem külön g és y hanem &amp;quot;gy&amp;quot;. Karakterek helyett beszédhangokat írunk. Ezt valami SAMPA átírással lehetne jól leírni.&lt;br /&gt;
&lt;br /&gt;
* Fonéma-&amp;gt;Fonéma konverziók avagy nem negyven-nek ejtjük ezt a szót így, hanem netyven-nek. Hasonulások, összeolvadások, rövidülések, kivetések. Eredmény (SAMPA-ban lenne ildomos írni): Mi(j)ért netyven százalék a határ?&lt;br /&gt;
&lt;br /&gt;
* Mindezekkel párhuzamosan fontos a prozódia mondatszintű, szószintű stb lebontása, relatív megadása. Ugyanígy intenzitással is. Amennyire lehetséges, hangsúlyhatárokat is bejelöljük (pl vessző előtt felmegy).&lt;br /&gt;
 &lt;br /&gt;
* Ha mindez megvan, egy adatmátrixot kapunk, melyben a szöveg minden lényeges elemét hangokra lebontva megadtuk, ami a kiejtéshez kell. &lt;br /&gt;
&lt;br /&gt;
Ezek főbb vonalakban: frázishatárok, szünetek, hangsúly, időtartam, F0, F0 töréspont, intenzitás. Utóbbi 4-et %-ban célszerű megadni. &lt;br /&gt;
&lt;br /&gt;
* Ezt az adatmátrixot kapja meg a triádos beszédgenerátor. &lt;br /&gt;
&lt;br /&gt;
* A beszédgenerátor veszi a hangkódokat a jelölésnek megfelelően. CVC helyzetbe triádot keres, egyéb helyzetekben pedig diádot. &lt;br /&gt;
&lt;br /&gt;
* Ezek hangosságát, frekvenciaszerkezetét és periódusidejét megváltoztatja a megadott százalékoknak stb. megfelelően. &lt;br /&gt;
* A szükséges helyekre megfelelő nagyságú szünetet illeszt be. &lt;br /&gt;
* Az egyes elemeket simító algoritmusokkal összefűzi. &lt;br /&gt;
* Utolsó lépés: a profit! &lt;br /&gt;
&lt;br /&gt;
==Definiciók és kiskérdések==&lt;br /&gt;
&lt;br /&gt;
Majdnem abc sorrendben..&lt;br /&gt;
&lt;br /&gt;
===Aliasing===&lt;br /&gt;
Ez a jelenség azt eredményezi, hogy a mintavételezett hullámforma torzulni fog visszaállításkor. Pl.: a Nyquist kritérium szerint 10 000 Hz mintavételezési frekvencia mellett az 5000 Hz feletti frekvenciájú hangkomponensek torzulni fognak visszaállításkor. Ezt úgy kezelik, hogy egy alul áteresztő anti-aliasing filterrel kiszűrik az 5000 Hz feletti komponenseket. &lt;br /&gt;
&lt;br /&gt;
===Alapfrekvencia (pitch)===&lt;br /&gt;
Az alapfrekvencia, azaz F0. A PSOLA (Pitch Synchronous Overlap Add Method) eljárás az alapfrekvenciát változtatja a beszéd dallamának változtatása érdekében.&lt;br /&gt;
&lt;br /&gt;
===Akusztikus vs nyelvi mód===&lt;br /&gt;
Az akusztikus modell az egyes beszédhangokra ad egy referencia-jellemzővektorokat, míg a nyelvi modell a beszédhangok kombinációs lehetőségeit adja meg szótárak segítségével, illetve akár a ragozáshoz nyújt megfelelő szabálybázist.&lt;br /&gt;
&lt;br /&gt;
===Artikulációs sebesség Milyen érték jellemző a magyarra? Mi a beszédsebesség?===&lt;br /&gt;
Az artikulációs sebesség az időegység alatt ejtett hasznos beszédhangok száma folyamatos ejtésnél, szünetek nélkül. &lt;br /&gt;
A magyar beszédnél tipikus értéke 13 hang/s. &lt;br /&gt;
A beszédsebesség a beszéd hangzásának teljes idejében, szünetekkel, időegység alatt elhangzott beszédhangok száma, a nem hasznos beszédjeleket is beleértve. (Magyar beszédnél 14 hang/s) &lt;br /&gt;
artikulációs sebesség &amp;lt;= beszédsebesség &lt;br /&gt;
&lt;br /&gt;
===Akusztikai dB és a Phon érték kapcsolata===&lt;br /&gt;
A Phon görbe az azonos hangosságérzetű görbék serege, ahol a referencia-frekvencia az 1 kHz. Azaz 1kHz-es hangok esetén a Phon érték megegyezik az akusztikai dB-el. &lt;br /&gt;
&lt;br /&gt;
===Beszédkódolók===&lt;br /&gt;
PCM: Pulse Code Modulation (logaritmikus), ezen belül van az A-law (EU) és -law (USA). Lineáris kvantálás. LPC - lineáris predikció. MPEG (layer 3). &lt;br /&gt;
&lt;br /&gt;
===DTMF===&lt;br /&gt;
Dual Tone MultiFrequency, DTMF jelek esete&amp;amp;#769;n nincs besze&amp;amp;#769;djel, i&amp;amp;#769;gy zavarja az e&amp;amp;#769;rthet&amp;amp;#305;se&amp;amp;#769;get, mert 2 szinusz hang szo&amp;amp;#769;lal csak meg, i&amp;amp;#769;gy a jel spektruma&amp;amp;#769;ban ko&amp;amp;#776;nnyen felismerhet&amp;amp;#305; lesz a 2 kiugro&amp;amp;#769; amplitudo&amp;amp;#769;&lt;br /&gt;
===F2 és B2? [[HOgyan]] határozhatóak meg? ===&lt;br /&gt;
F2 a besze&amp;amp;#769;djel ma&amp;amp;#769;sodik forma&amp;amp;#769;nsa, avagy az akusztikum ma&amp;amp;#769;sodik legkisebb feler&amp;amp;#305;si&amp;amp;#769;tett felhangnyala&amp;amp;#769;ba, a B2 pedig ennek a forma&amp;amp;#769;nsnak a sa&amp;amp;#769;vsze&amp;amp;#769;lesse&amp;amp;#769;ge. F2 meghata&amp;amp;#769;rozhato&amp;amp;#769; a jel spektruma&amp;amp;#769;bo&amp;amp;#769;l, ez a ma&amp;amp;#769;sodik legkisebb er&amp;amp;#305;si&amp;amp;#769;te&amp;amp;#769;si hely (loka&amp;amp;#769;lis maximum), a &lt;br /&gt;
&lt;br /&gt;
B2- t pedig ezen a maximum alatt 3 dB-lel meghu&amp;amp;#769;zott vonal e&amp;amp;#769;s a burkolo&amp;amp;#769;go&amp;amp;#776;rbe metsze&amp;amp;#769;spontja jelo&amp;amp;#776;li ki.&lt;br /&gt;
&lt;br /&gt;
===ITU P.800? ===&lt;br /&gt;
Az ETSI egyik szubjekti&amp;amp;#769;v besze&amp;amp;#769;dmin&amp;amp;#305;si&amp;amp;#769;t&amp;amp;#305; szabva&amp;amp;#769;nya. Min&amp;amp;#305;si&amp;amp;#769;thetu&amp;amp;#776;nk abszolu&amp;amp;#769;t mo&amp;amp;#769;don, el&amp;amp;#305;re definia&amp;amp;#769;lt ska&amp;amp;#769;la alapja&amp;amp;#769;n (ACR)&lt;br /&gt;
&amp;#039;jelense&amp;amp;#769;g&amp;#039; e&amp;amp;#769;szlele&amp;amp;#769;si tesztek romla&amp;amp;#769;s megfigyele&amp;amp;#769;se eredetihez ke&amp;amp;#769;pest (DCR) referencia rendszerrel o&amp;amp;#776;sszehasonli&amp;amp;#769;ta&amp;amp;#769;s (MNRU)&lt;br /&gt;
&lt;br /&gt;
===ergodikus===&lt;br /&gt;
A folyamat tulajdonsága. Ha a folyamat ergodikus, akkor 1 folyamat is magában hordozza a sokaság tulajdonságait. &lt;br /&gt;
&lt;br /&gt;
===F1===&lt;br /&gt;
Az első formáns. Magánhangzók jellemzéséhez a formánsokat használjuk. Az alapfrekvencia az F0, ennek egészszámú többszörösei a formánsok. F1 az F0-hoz legközelebb eső formáns. &lt;br /&gt;
&lt;br /&gt;
===HMM===&lt;br /&gt;
Hidden Markov Model - Rejtett Markov Model. Statisztikai alapú beszédfelismerési módszer. &lt;br /&gt;
&lt;br /&gt;
===Hanning-ablak és a szonogram kapcsolata?===&lt;br /&gt;
Ha gördülő spektrumot avagy szonogramot szeretnénk készíteni, akkor az időben folytonos jelünket bizonyos kis szeletekben mintavételeznünk kell. A kis kivágott időintervallumokból akkor kapunk jó spektrumot, ha azt megfelelően kiablakozzuk és nem csak simán kivágjuk egy négyzetes ablakkal. Egy ilyen jól bevált ablakozó függvény a Hanning ablak, melynek képlete:  ***** fix me *****&lt;br /&gt;
&lt;br /&gt;
===LPC===&lt;br /&gt;
Lineáris predikció. Bizonyos esetekben ha nem a mintát, hanem a minták különbségét kvantáljuk, akkor kevesebb biten tudjuk átvinni ugyanazt az információt (tömörítés). &lt;br /&gt;
&lt;br /&gt;
===Locus, az F2 és F0 kapcsolata?===&lt;br /&gt;
A CV átmenet jellegzetessége a locus: megfigyelték, hogy pl. a d után ejtett magánhangzók felfutó szakaszait, ha visszafelé meghosszabbítjuk, ezek egy pontban metszik egymást &amp;amp;#8211; a legtöbb mássalhangzó az őt követő magánhangzó vagy őt megelőző magánhangzó második formánsát (F2) a szóban forgó mássalhangzót jellemző frekvenciára kényszeríti, ezek a locusok. &lt;br /&gt;
Az F2 pedig nem más, mint a hangszalagoknál képzett gerjesztő jel alapfrekvenciájából (F0) a vokális traktusban felerősített, második legkisebb felhang-nyaláb (Fn).&lt;br /&gt;
&lt;br /&gt;
===Néma fázis. Sorolja fel az összes beszédelemet, amelyre vonatkozhat!*===&lt;br /&gt;
Néma fázis: A zárhangok azon része, amelyben nincs hangképzés. A tüdőből kiáramló levegő a toldalékcsőben képzett akadály miatt feltorlódik és a zárfelpattanásig levegőáram nem hagyja el az artikulációs csatornát. &lt;br /&gt;
A fentiek alapján néma fázis található a zöngétlen zár- és zárréshangoknál így: p, t, k, ty, c, cs.&lt;br /&gt;
&lt;br /&gt;
===Ne&amp;amp;#769;gyszo&amp;amp;#776;gletes ablak. Mi a szerepe a besze&amp;amp;#769;dfeldolgoza&amp;amp;#769;sban? ===&lt;br /&gt;
A Fourier-integra&amp;amp;#769;la&amp;amp;#769;s sora&amp;amp;#769;n egy kis id&amp;amp;#305;keret anali&amp;amp;#769;zise u&amp;amp;#769;gy to&amp;amp;#776;rte&amp;amp;#769;nhet meg, hogy az id&amp;amp;#305;ben folyamatos jelet egyma&amp;amp;#769;ssal a&amp;amp;#769;tlapolo&amp;amp;#769;do&amp;amp;#769;&lt;br /&gt;
ne&amp;amp;#769;gyszo&amp;amp;#776;gletes ablakokkal kiablakozzuk. I&amp;amp;#769;gy kis id&amp;amp;#305;szakaszokra megkaphatjuk a jel spektruma&amp;amp;#769;t, ami a magasabbrendo&lt;br /&gt;
&lt;br /&gt;
===Mikor és ki készítette az első beszédkeltő gépet a világon? Hol látható?===&lt;br /&gt;
Kempelen Farkas, *1791*-ben. Ma az MTA Nyelvtudományi Intézetében látható. (legalábbis ajánlom neki h ottlegyen..) &lt;br /&gt;
Mikor és ki adta be a világ első szabadalmát tetszőleges szöveg felolvasására alkalmas beszélőgépre? &lt;br /&gt;
Bánó Miklós, *1916*-ban. &lt;br /&gt;
&lt;br /&gt;
===MP3===&lt;br /&gt;
MPEG-1 Audio Layer 3. (nem MPEG-3) Veszteséges tömörítés. Az emberi fül számára nem hallható hangokat eldobja. &lt;br /&gt;
Részletesebben: &lt;br /&gt;
Érzeti (részsávos kódolás) percetptual (subband) coding&lt;br /&gt;
Frekvenciamaszkolási jelenség (elfedés a frekvenciatartományban)&lt;br /&gt;
  1)minden sávra megállapítjuk, hogy milyen energiájú összetevok vannak a jelben&lt;br /&gt;
  2)az elfedett összetevok kihagyása&lt;br /&gt;
  3)a kvantálási zaj növelésének lehetősége: úgy kvantálunk, hogy a kvantálási zaj ne legyen nagyobb, mint az elfedési szint (itt a tömörítési lehetőség)&lt;br /&gt;
&lt;br /&gt;
===Mintaillesztési eljárások===&lt;br /&gt;
Szabályalapú, statisztikai alapú (HMM - Hidden Markov Model és ANN - Artificial Neuro Network ) illetve sablon alapú (DTW). &lt;br /&gt;
&lt;br /&gt;
===Megfigyelési valósznűség===&lt;br /&gt;
Azt az értéket adja meg, hogy mennyi annak a valószínűsége, hogy egy HMM rendszer x állapotában j jellemzővektort figyeljünk meg. &lt;br /&gt;
&lt;br /&gt;
===VXML===&lt;br /&gt;
Voice eXtended Markup Language - dialógusok leírására alkalmas  &lt;br /&gt;
&lt;br /&gt;
===Mi a VXML, a SUI és a DTMF kapcsolata a beszédinformációs rendszerekkel?===&lt;br /&gt;
Mindegyik a beszédinformációs rendszerek felépítését segíti, illetve annak egy eleme. &lt;br /&gt;
A VXML avagy Voice eXtensible Markup Language interaktív dialógusok leírását és tervezését könnyíti meg ember és számítógép között. &lt;br /&gt;
A SUI avagy Speech User Interface az ember-gép kapcsolatot beszéd és hangok által teremti meg. &lt;br /&gt;
A DTMF avagy Dual Tone Multi Frequency egy jeltovábbítási megoldás avagy mechanizmus a normál telefonvonalon keresztül, ahol 2 frekvencia együttes megszólaltatásával összesen 16 különböző jelet generálhatunk (4*4=16). &lt;br /&gt;
&lt;br /&gt;
===Relatív hangosság. Hányszorosa a hangosság a 40 phon hangnak?===&lt;br /&gt;
Képlettel: N = 2 ^ [(L - 40) / 10] L: phon , hangosságérzet. 40 phon = 1 son, 50 phon = 2 son , 60 phon = 4 son stb. &lt;br /&gt;
&lt;br /&gt;
===SAMPA. Van-e szerepe a besze&amp;amp;#769;de&amp;amp;#769;rte&amp;amp;#769;sben? Kapcsolatba hozhato&amp;amp;#769;-e a jel spektruma&amp;amp;#769;val? ===&lt;br /&gt;
SAMPA: Speech Assessment Methods Phonetic Alphabet. Besze&amp;amp;#769;dhangok jelo&amp;amp;#776;le&amp;amp;#769;se 7 bites ASCII karakterekkel.&lt;br /&gt;
A SAMPA-val a besze&amp;amp;#769;dhangok egye&amp;amp;#769;rtelmo&amp;amp;#779;en lei&amp;amp;#769;rhato&amp;amp;#769;k, segi&amp;amp;#769;thet a besze&amp;amp;#769;de&amp;amp;#769;rte&amp;amp;#769;sben.&lt;br /&gt;
Szerintem nem hozhato&amp;amp;#769; kapcsolatba a jel spektruma&amp;amp;#769;val. Vagy csak nagyon o&amp;amp;#776;sszetett, indirekt mo&amp;amp;#769;don.&lt;br /&gt;
&lt;br /&gt;
===SNR===&lt;br /&gt;
Snr = 1.74 + 6.02 * 16 bit = 98.06dB&lt;br /&gt;
&lt;br /&gt;
===Screen reader és TTS kapcsolata===&lt;br /&gt;
A screen reader csak egy illeszt&amp;amp;#305; alkalmaza&amp;amp;#769;s a ke&amp;amp;#769;perny&amp;amp;#305; e&amp;amp;#769;s a TTS ko&amp;amp;#776;zo&amp;amp;#776;tt, a ke&amp;amp;#769;perny&amp;amp;#305;n tala&amp;amp;#769;lhato&amp;amp;#769; informa&amp;amp;#769;cio&amp;amp;#769;t adja a&amp;amp;#769;t felolvasa&amp;amp;#769;sra a TTS sza&amp;amp;#769;ma&amp;amp;#769;ra.&lt;br /&gt;
&lt;br /&gt;
===Spektrális átlapolódás oka mintavételezéskor? Hogyan előzhető meg? Adjon példát.===&lt;br /&gt;
Spektrális átlapolódás: ha a hang mintavételezésénél a mintavételezési frekvencia kisebb, mint a legnagyobb frekvenciakomponens kétszerese, a visszaállításnál nemkívánatos jelek kerülnek visszaállításra, a jel nem állíthatő elő egyértelműen/hűségesen. &lt;br /&gt;
Megelőzhető megfelelő karakterisztikájú aluláteresztő szűrővel a bemeneten. (Sávkorlátozás) &lt;br /&gt;
Példát mindenki remélem tud adni ezek alapján :] &lt;br /&gt;
&lt;br /&gt;
===Triád===&lt;br /&gt;
Egy triádos adatbázisban három hosszú hangkombinációkra tároljuk a hullámformákat. A tárolt adatok mennyisége ezért a fonémák köbével arányos. A tárolt hang az első fonéma közepénél kezdődik és a harmadik közepénél fejeződik be.&lt;br /&gt;
&lt;br /&gt;
* El&amp;amp;#305;nyei: A maga&amp;amp;#769;nhangzo&amp;amp;#769;kna&amp;amp;#769;l nem le&amp;amp;#769;p fel torzi&amp;amp;#769;ta&amp;amp;#769;s a forma&amp;amp;#769;nsok megto&amp;amp;#776;re&amp;amp;#769;se miatt. Terme&amp;amp;#769;szetesebb hangza&amp;amp;#769;s Ko&amp;amp;#776;nnyebb szo&amp;amp;#776;vegterveze&amp;amp;#769;s&lt;br /&gt;
* Ha&amp;amp;#769;tra&amp;amp;#769;nyai: Sok munka&amp;amp;#769;t jelent a felve&amp;amp;#769;tel Sok memo&amp;amp;#769;ria&amp;amp;#769;t foglal Sok szo&amp;amp;#776;veget kell felolvastatni Dia&amp;amp;#769;dokat e&amp;amp;#769;s egye&amp;amp;#769;b elemeket is ige&amp;amp;#769;nyel az adatba&amp;amp;#769;zis&lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
===Teljesítmény sűrűség spektrum ===&lt;br /&gt;
Az akusztikai dB-ből visszakövetkeztethetünk a hangjel amplitudójára (10-es hatványraemelés), az így kapott időjel négyzete a teljesítmény sűrűség spektrum. (ha jól mondom :] ) &lt;br /&gt;
&lt;br /&gt;
===*VOT* A beszédjel mely részén mérhető? Adjon 5 konkrét példát indoklással!===&lt;br /&gt;
VOT: Voice Onset Time avagy zöngekezdési idő &lt;br /&gt;
felpattanó zárhangok esetén a zár felpattanása és az azt követő magánhangzó megszólalása között eltelt idő &lt;br /&gt;
Tipikusan a beszéd azon helyen mérhető, ahol gerjesztésváltás történik, és zöngétlen hangot zöngés hang követ. &lt;br /&gt;
A fentiek fényében a VOT pl. p után 8ms, t után 15ms, k után 26ms. (Ide lényegesen többet nem tudok írni, főleg az indoklás részét nem értem) &lt;br /&gt;
&lt;br /&gt;
&lt;br /&gt;
[[Category:Infoalap]]&lt;/div&gt;</summary>
		<author><name>Unknown user</name></author>
	</entry>
</feed>