„Számítógépes látórendszerek - Ellenőrző kérdések: Mérések” változatai közötti eltérés

Nagy Marcell (vitalap | szerkesztései)
a autoedit v2: fájlhivatkozások egységesítése, az új közvetlenül az adott fájlra mutat
 
(18 közbenső módosítás, amit 4 másik szerkesztő végzett, nincs mutatva)
1. sor: 1. sor:
{{Vissza|Számítógépes látórendszerek}}
{{Vissza|Számítógépes látórendszerek}}
== Hogyan definiálhatjuk egy objektum pozícióját? Ismertesse a pozíciómérés lehetőségeit. Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken. ==
== Hogyan definiálhatjuk egy objektum pozícióját? <br/> Ismertesse a pozíciómérés lehetőségeit.<br/> Mutassa meg, hogy lehet a pozíció értékét meghatározni bináris és maszkolt szürkeárnyalatos képeken. ==
Egy 2D-s képet ábrázolhatunk egy derékszögű koordinátarendszerben, ahol az egyes pixelekhez hozzárendelhetünk egy (x,y) egész koordinátapárt. A koordinátarendszer középpontja tetszőlegesen, feladattól függően megválasztható, de általában a bal felső sarokban lévő pixelhez rendeljük hozzá a (0,0)-t.
Egy 2D-s képet ábrázolhatunk egy derékszögű koordinátarendszerben, ahol az egyes pixelekhez hozzárendelhetünk egy (x,y) egész koordinátapárt. A koordinátarendszer középpontja tetszőlegesen, feladattól függően megválasztható, de általában a bal felső sarokban lévő pixelhez rendeljük hozzá a (0,0)-t.
Egy objektum pozíciója az objektum egy jellegzetes koordinátapárjával jellemezhető.
Egy objektum pozíciója az objektum egy jellegzetes koordinátapárjával jellemezhető.
Ez a koordinátapár lehet:
Ez a koordinátapár lehet:
geometriai középpont – az objektumot befoglaló téglalap/kör középpontja
geometriai középpont – az objektumot befoglaló téglalap/kör középpontja
tömegközéppont
tömegközéppont


=== Tömegközéppont <math>(x_c,y_c)</math> meghatározása ===
=== Tömegközéppont <math>(x_c,y_c)</math> meghatározása ===
A kép mérete: <math> M \cdot N </math> pixel
A kép mérete: <math> M \cdot N </math> pixel (<math>M</math> az oszlopok száma, <math>N</math> a soroké)
*<math> p_x(x) = </math>  az <math> x</math>  koordinátájú sorban a vizsgált objektum pixeleinek száma
*<math> p_x(x) = </math>  az <math> x</math>  koordinátájú oszlopban a vizsgált objektum pixeleinek száma
*<math> p_y(y) = </math>  az  <math>y</math>  koordinátájú oszlopban a vizsgált objektum pixeleinek száma
*<math> p_y(y) = </math>  az  <math>y</math>  koordinátájú sorban a vizsgált objektum pixeleinek száma
==== Bináris képekre ====
==== Bináris képekre ====
[[File:Számítógépes_látórendszerek_bináris_kép_1.jpg]]
==== Szürkeárnyalatos képekre ====
==== Szürkeárnyalatos képekre ====
<math>I(x,y) </math>: intenzitásfüggvény
<math>I(x,y) </math>: intenzitásfüggvény
[[File:Számítógépes_látórendszerek_szürkeárnyalatos_kép_1.png]]


=== Geometriai középpont <math>(x_g,y_g)</math> meghatározása ===
=== Geometriai középpont <math>(x_g,y_g)</math> meghatározása ===
====Meghatározás a befoglaló téglalap alapján====
<math> x_{min}, x_{max}, y_{min}, y_{max} </math> : az objektum legszélső pixeleinek koordinátái
<math> x_{min}, x_{max}, y_{min}, y_{max} </math> : az objektum legszélső pixeleinek koordinátái


== Hogyan definiálhatjuk egy objektum orientációját? Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét. ==
<math> x_g = \frac{x_{min} + x_{max}}{2} </math> és <math> y_g = \frac{y_{min} + y_{max}}{2} </math>
 
<math> (x_g, y_g) </math> a téglalap középpontja, azaz a geometriai középpont.
 
====Meghatározás a befoglaló kör alapján====
* egyértelmű, ha 3 ponton érinti a kört
* kör átlójáig egyértelmű, ha 2 ponton érinti a kört.
 
== Hogyan definiálhatjuk egy objektum orientációját? <br/>Sorolja fel az orientációmérés lehetőségeit, illetve röviden ismertesse ezek alapelvét. ==
Objektum orientációján egy objektum egy olyan 1D-s jellemzését értjük, mely irány-, szöginformációkat szolgáltat az adott objektumról.
Objektum orientációján egy objektum egy olyan 1D-s jellemzését értjük, mely irány-, szöginformációkat szolgáltat az adott objektumról.
Objektum orientációja megadható a
Objektum orientációja megadható a
26. sor: 40. sor:
*rá illeszthető legkisebb nyomatékú tengellyel
*rá illeszthető legkisebb nyomatékú tengellyel


== Mit jelent az Euler szám? Mire használható? Adja meg a mellékelt ábra Euler számát. ==
== Mit jelent az Euler szám?<br/> Mire használható?<br/> Adja meg a mellékelt ábra Euler számát. ==
Az Euler-szám egyike a topológiai tulajdonságoknak, melyek egy kép geometriai leírását segítik elő. Fontos része az ilyen tulajdonságoknak, hogy rubber-sheet jellegű transzormációkra invariáns.
Az Euler-szám egyike a topológiai tulajdonságoknak, melyek egy kép geometriai leírását segítik elő. Fontos része az ilyen tulajdonságoknak, hogy rubber-sheet jellegű transzormációkra invariáns.
Az ilyen jellegű tulajdonságok jól használhatók formák keresésére, objektumok felismerésére, adatbázisbeli keresésre.
Az ilyen jellegű tulajdonságok jól használhatók formák keresésére, objektumok felismerésére, adatbázisbeli keresésre.
33. sor: 47. sor:
'''Euler-szám = (egybefüggő régiók száma) – (lyukak száma)'''
'''Euler-szám = (egybefüggő régiók száma) – (lyukak száma)'''


== Mit jelent a lánckód? Mire használható? Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak? Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak? ==
[[File:Számítógépes látórendszerek Euler-szám példa.png|600px]]
 
== Mit jelent a lánckód? Mire használható?<br/> Mi a különbség a 4-szomszádos és 8-szomszédos lánckód között? Mik az előnyei és a hátrányai az így ábrázolt objektumoknak?<br/> Hogyan tudunk segítségével kerület- és hossz-számítást végezni? Milyen problémák adódnak? ==
A lánckód egy veszteségmentes tömörítési algoritmus bináris képekhez. Lánckód segítségével alakfelismerést, sarokdetektálást végezhetünk. (A kódból egyértelműen látszik, hol vannak pl.: dudorok, bemélyedések.)
A lánckód egy veszteségmentes tömörítési algoritmus bináris képekhez. Lánckód segítségével alakfelismerést, sarokdetektálást végezhetünk. (A kódból egyértelműen látszik, hol vannak pl.: dudorok, bemélyedések.)
Az objektum egy szélső pixelétől elindulva szomszédos, határ menti pixelekre lépkedünk. Attól függően, hogy milyen irányba lépünk tovább a pixelhez egy számot rendelünk hozzá. Ez a számsorozat alkotja a lánckódot.
Az objektum egy szélső pixelétől elindulva szomszédos, határ menti pixelekre lépkedünk. Attól függően, hogy milyen irányba lépünk tovább a pixelhez egy számot rendelünk hozzá. Ez a számsorozat alkotja a lánckódot.
43. sor: 59. sor:


=== Kerület = kódhossz ===
=== Kerület = kódhossz ===
Hossz számításnál kerül elő az a probléma, hogy négyzetes pixelek esetén egy átlós lépés valóságos hossza sqrt(2) egység. 4-szomszédos lánckód 2 egység hosszúnak, míg a 8-szomszédos esetben 1 egység hosszúnak veszi alapból.  Ha szükséges akkor ezt kompenzálni kell.
Hossz számításnál kerül elő az a probléma, hogy négyzetes pixelek esetén egy átlós lépés valóságos hossza <math>sqrt(2)</math> egység. 4-szomszédos lánckód 2 egység hosszúnak, míg a 8-szomszédos esetben 1 egység hosszúnak veszi alapból.  Ha szükséges akkor ezt kompenzálni kell.
 
[[File:Számítógépes_látórendszerek_lánckód_1.jpg]]
 
[http://cs.haifa.ac.il/hagit/courses/ip/Lectures/Ip13_Binary.pdf Forrás]


== Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel? ==
== Ismertessen szubpixeles eljárásokat. Hogyan tudunk pozíciót, kerületet, ill. területet mérni segítségükkel? ==
Interpoláció alapú eljárás, mely segítségével pixel alatti pontossággal illeszthetünk görbét egy objektumra.
Interpoláció alapú eljárás, mely segítségével pixel alatti pontossággal illeszthetünk görbét egy objektumra.
Megfelelő algoritmussal akár 0.1% pontosság is elérhető
Megfelelő algoritmussal akár 0.1% pontosság is elérhető. <br/><br/>
=== Eljárás szürkeárnyalatos képekhez ===
''' Eljárás szürkeárnyalatos képekhez '''
#Szürkeárnyalatos képeket először is binarizáljuk.
#Szürkeárnyalatos képeket először is binarizáljuk.
#Visszatérve az eredeti képhez (fekete-fehér kép alapján) az átmeneteknél lévő pixelekhez egy súlytényezőt (értéke lehet tört, megadja az interpoláció finomságát) rendelünk attól függően, hogy mennyire világos/sötét az adott pixel.
#Visszatérve az eredeti képhez (fekete-fehér kép alapján) az átmeneteknél lévő pixelekhez egy súlytényezőt (értéke lehet tört, megadja az interpoláció finomságát) rendelünk attól függően, hogy mennyire világos/sötét az adott pixel.
55. sor: 75. sor:
Pozíciószámítás során a 3. lépésben meghatározott határpontok koordinátáit használjuk fel a képletekben.
Pozíciószámítás során a 3. lépésben meghatározott határpontok koordinátáit használjuk fel a képletekben.
Kerület, területnél hasonlóan.
Kerület, területnél hasonlóan.
== Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését. ==
== Ismertesse az egyenesekre vonatkozó Hough-transzformáció működését. ==
=== Hough-transzformáció ===
=== Hough-transzformáció ===
76. sor: 97. sor:
*Az így kapott egyenes valamennyi rá szavazó ponton átmegy a képtérben.  
*Az így kapott egyenes valamennyi rá szavazó ponton átmegy a képtérben.  
*A Hough-tér küszöbölésével megkapjuk a képtér egyeneseit.
*A Hough-tér küszöbölésével megkapjuk a képtér egyeneseit.
[[File:Számítógépes_látórendszerek_egyenes_1.jpg]]