„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés

Nagy Marcell (vitalap | szerkesztései)
a autoedit v2: fájlhivatkozások egységesítése, az új közvetlenül az adott fájlra mutat
 
(5 közbenső módosítás, amit 2 másik szerkesztő végzett, nincs mutatva)
54. sor: 54. sor:
*Optical Flow piramis.
*Optical Flow piramis.


== Mit nevezünk sarokszerű képrészletnek? Ismertesse a Harris operátor elvét és lépéseit! ==
== Mit nevezünk sarokszerű képrészletnek? <br/>Ismertesse a Harris operátor elvét és lépéseit! ==


== Milyen képtranszformációkat ismer? Ezek közül melyekre invariáns a Harris operátor? ==
Mi a képi sarok?
*Él: Ahol valamilyen irányban az intenzitásban egy ugrás van.
*Sarok: Ahol az intenzitás minden irányban ugrik!


== Ismertesse a SIFT eljárás képrészletdetektáló részét! Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
Harris detektor alapelve:
* Vegyünk egy ablakot a pont körül.
* Mozgassuk el minden irányba, és számoljuk ki a hibát a kép és az ablak közt.
* Ha minden irányban nagy a hiba, akkor sarokpontunk van.
 
 
<math>R = det(H) - k \cdot trace(H)^2</math>
 
<math>k \in [0,04-0,06]</math>
 
 
[[File:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]]
 
== Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? ==
 
*Intenzitásváltozás:
**Additív intenzitásváltozás: <math>I \to I+b</math>
**Multiplikatív intenzitásváltozás: <math>I \to aI</math>
**Csak részlegesen invariáns rá a Harris detektor.
*Forgatás:
**A sajátvektorok változnak, de a sajátértékek nem!
**Invariáns rá a Harris detektor.
*Skálázás:
**Nincs invariancia!
 
== Ismertesse a SIFT eljárás képrészletdetektáló részét! <br/>Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
 
SIFT = Scale Invariant Feature Transform
 
*Keressünk kulcspontokat
**Érdekes (sarokszerű) legyen
**Keressünk skálainvariáns módon
*Készítsünk minden régióhoz egy leírót, ami intenzitás, skála és rotáció invariáns
 
Sarokdetektálást végezzünk el több skálafaktor mellett. Ezt a skálafaktort tároljuk el az egyes jellemzőkhöz. Difference of Gaussians, azaz két eltérő szélességű (szórású) gauss szűrő különbsége - Valóságban gauss-szal szűrt képek kivonása. A DoG szűrő maximuma ott lesz a skálatérben, ahol az objektum mérete egybeesik a szűrő inflexiós pontjával → Ez lesz a jó skála!
 
 
Kulcspontok pozíciójában szubpixeles pontosságot követelünk meg! Interpolációra lesz szükség három dimenzióban (x,y,skála)
 
Az így megtalált kulcspontokat szűrni kell! Nem elég kontrasztos régió. Élszerű régió (sajátértékekkel).


== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük.
*Minden pixelre kiszámoljuk a gradiens nagyságát és irányát.
*A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz).
*Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal.
A jellemző orientációja az így készült hisztogram maximumánál lesz.
A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor.