„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés

← Régebbi szerkesztés

VizuálisWikiszöveges

@@ 19. sor: / 19. sor: @@
 <math>I_xu+I_yv=-I_t</math>
-== Mutassa be a Lucas-Kanade algoritmust és annak célját! Milyen módszereket ismer a gyors mozgások követésére optikai áramlás segítségével? ==
+== Mutassa be a Lucas-Kanade algoritmust és annak célját! <br/>Milyen módszereket ismer a gyors mozgások követésére optikai áramlás segítségével? ==
-== Mit nevezünk sarokszerű képrészletnek? Ismertesse a Harris operátor elvét és lépéseit! ==
+Az optikai áramlás algoritmusánál feltételeztük, hogy az egymáshoz közeli pixelek azonos objektumhoz tartoznak, ezért együtt mozognak. Ne a pixelt nézzük, hanem a környezetét! Több pont együttes kezelése esetén az alulhatározott egyenletből túlhatározott lesz (Lucas-Kanade módszer).
-== Milyen képtranszformációkat ismer? Ezek közül melyekre invariáns a Harris operátor? ==
+A környezet elmozdulásának négyzetes hibáját minimalizáljuk. Parciális derivált = 0 helyen optimum.
-== Ismertesse a SIFT eljárás képrészletdetektáló részét! Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
+<math>E=\sum {\left ( uI_{x} +vI_{y} + I_{t}\right )^{2}} \rightarrow Min</math>
+<math>\frac{\partial E}{\partial u} = 0 \; \; \; \frac{\partial E}{\partial v} = 0</math>
+<math>\begin{bmatrix}
+\sum I_{x}^{2} & \sum I_{x}I_{y}\\
+\sum I_{x}I_{y} & \sum I_{y}^{2}
+\end{bmatrix} \cdot
+\begin{bmatrix}
+u \\
+v
+\end{bmatrix} =
+\begin{bmatrix}
+- \sum I_{x}I_{t} \\
+- \sum I_{y}I_{t}
+\end{bmatrix}</math>
+<math>H \vec{u} = b \to \vec{u} = H^{-1} b</math>
+Az Lucas-Kanade egyenlet megoldható, ha Az H sajátértékei nem túl kicsik (vagy nullák) és a H sajátértékeinek aránya nem túl nagy (H jól kondicionált).
+Egyéb módszerek a gyors mozgások követésére:
+*Iteratív Lucas-Kanade algoritmus.
+*Optical Flow piramis.
+== Mit nevezünk sarokszerű képrészletnek? <br/>Ismertesse a Harris operátor elvét és lépéseit! ==
+Mi a képi sarok?
+*Él: Ahol valamilyen irányban az intenzitásban egy ugrás van.
+*Sarok: Ahol az intenzitás minden irányban ugrik!
+Harris detektor alapelve:
+* Vegyünk egy ablakot a pont körül.
+* Mozgassuk el minden irányba, és számoljuk ki a hibát a kép és az ablak közt.
+* Ha minden irányban nagy a hiba, akkor sarokpontunk van.
+<math>R = det(H) - k \cdot trace(H)^2</math>
+<math>k \in [0,04-0,06]</math>
+[[File:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]]
+== Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? ==
+*Intenzitásváltozás:
+**Additív intenzitásváltozás: <math>I \to I+b</math>
+**Multiplikatív intenzitásváltozás: <math>I \to aI</math>
+**Csak részlegesen invariáns rá a Harris detektor.
+*Forgatás:
+**A sajátvektorok változnak, de a sajátértékek nem!
+**Invariáns rá a Harris detektor.
+*Skálázás:
+**Nincs invariancia!
+== Ismertesse a SIFT eljárás képrészletdetektáló részét! <br/>Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
+SIFT = Scale Invariant Feature Transform
+*Keressünk kulcspontokat
+**Érdekes (sarokszerű) legyen
+**Keressünk skálainvariáns módon
+*Készítsünk minden régióhoz egy leírót, ami intenzitás, skála és rotáció invariáns
+Sarokdetektálást végezzünk el több skálafaktor mellett. Ezt a skálafaktort tároljuk el az egyes jellemzőkhöz. Difference of Gaussians, azaz két eltérő szélességű (szórású) gauss szűrő különbsége - Valóságban gauss-szal szűrt képek kivonása. A DoG szűrő maximuma ott lesz a skálatérben, ahol az objektum mérete egybeesik a szűrő inflexiós pontjával → Ez lesz a jó skála!
+Kulcspontok pozíciójában szubpixeles pontosságot követelünk meg! Interpolációra lesz szükség három dimenzióban (x,y,skála)
+Az így megtalált kulcspontokat szűrni kell! Nem elég kontrasztos régió. Élszerű régió (sajátértékekkel).
 == Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
+A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük.
+*Minden pixelre kiszámoljuk a gradiens nagyságát és irányát.
+*A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz).
+*Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal.
+A jellemző orientációja az így készült hisztogram maximumánál lesz.
+A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor.