„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés
a autoedit v2: fájlhivatkozások egységesítése, az új közvetlenül az adott fájlra mutat |
|||
(7 közbenső módosítás, amit 2 másik szerkesztő végzett, nincs mutatva) | |||
19. sor: | 19. sor: | ||
<math>I_xu+I_yv=-I_t</math> | <math>I_xu+I_yv=-I_t</math> | ||
== Mutassa be a Lucas-Kanade algoritmust és annak célját! Milyen módszereket ismer a gyors mozgások követésére optikai áramlás segítségével? == | == Mutassa be a Lucas-Kanade algoritmust és annak célját! <br/>Milyen módszereket ismer a gyors mozgások követésére optikai áramlás segítségével? == | ||
Az optikai áramlás algoritmusánál feltételeztük, hogy az egymáshoz közeli pixelek azonos objektumhoz tartoznak, ezért együtt mozognak. Ne a pixelt nézzük, hanem a környezetét! Több pont együttes kezelése esetén az alulhatározott egyenletből túlhatározott lesz (Lucas-Kanade módszer). | |||
= | A környezet elmozdulásának négyzetes hibáját minimalizáljuk. Parciális derivált = 0 helyen optimum. | ||
== Ismertesse a SIFT eljárás képrészletdetektáló részét! Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? == | <math>E=\sum {\left ( uI_{x} +vI_{y} + I_{t}\right )^{2}} \rightarrow Min</math> | ||
<math>\frac{\partial E}{\partial u} = 0 \; \; \; \frac{\partial E}{\partial v} = 0</math> | |||
<math>\begin{bmatrix} | |||
\sum I_{x}^{2} & \sum I_{x}I_{y}\\ | |||
\sum I_{x}I_{y} & \sum I_{y}^{2} | |||
\end{bmatrix} \cdot | |||
\begin{bmatrix} | |||
u \\ | |||
v | |||
\end{bmatrix} = | |||
\begin{bmatrix} | |||
- \sum I_{x}I_{t} \\ | |||
- \sum I_{y}I_{t} | |||
\end{bmatrix}</math> | |||
<math>H \vec{u} = b \to \vec{u} = H^{-1} b</math> | |||
Az Lucas-Kanade egyenlet megoldható, ha Az H sajátértékei nem túl kicsik (vagy nullák) és a H sajátértékeinek aránya nem túl nagy (H jól kondicionált). | |||
Egyéb módszerek a gyors mozgások követésére: | |||
*Iteratív Lucas-Kanade algoritmus. | |||
*Optical Flow piramis. | |||
== Mit nevezünk sarokszerű képrészletnek? <br/>Ismertesse a Harris operátor elvét és lépéseit! == | |||
Mi a képi sarok? | |||
*Él: Ahol valamilyen irányban az intenzitásban egy ugrás van. | |||
*Sarok: Ahol az intenzitás minden irányban ugrik! | |||
Harris detektor alapelve: | |||
* Vegyünk egy ablakot a pont körül. | |||
* Mozgassuk el minden irányba, és számoljuk ki a hibát a kép és az ablak közt. | |||
* Ha minden irányban nagy a hiba, akkor sarokpontunk van. | |||
<math>R = det(H) - k \cdot trace(H)^2</math> | |||
<math>k \in [0,04-0,06]</math> | |||
[[File:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]] | |||
== Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? == | |||
*Intenzitásváltozás: | |||
**Additív intenzitásváltozás: <math>I \to I+b</math> | |||
**Multiplikatív intenzitásváltozás: <math>I \to aI</math> | |||
**Csak részlegesen invariáns rá a Harris detektor. | |||
*Forgatás: | |||
**A sajátvektorok változnak, de a sajátértékek nem! | |||
**Invariáns rá a Harris detektor. | |||
*Skálázás: | |||
**Nincs invariancia! | |||
== Ismertesse a SIFT eljárás képrészletdetektáló részét! <br/>Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? == | |||
SIFT = Scale Invariant Feature Transform | |||
*Keressünk kulcspontokat | |||
**Érdekes (sarokszerű) legyen | |||
**Keressünk skálainvariáns módon | |||
*Készítsünk minden régióhoz egy leírót, ami intenzitás, skála és rotáció invariáns | |||
Sarokdetektálást végezzünk el több skálafaktor mellett. Ezt a skálafaktort tároljuk el az egyes jellemzőkhöz. Difference of Gaussians, azaz két eltérő szélességű (szórású) gauss szűrő különbsége - Valóságban gauss-szal szűrt képek kivonása. A DoG szűrő maximuma ott lesz a skálatérben, ahol az objektum mérete egybeesik a szűrő inflexiós pontjával → Ez lesz a jó skála! | |||
Kulcspontok pozíciójában szubpixeles pontosságot követelünk meg! Interpolációra lesz szükség három dimenzióban (x,y,skála) | |||
Az így megtalált kulcspontokat szűrni kell! Nem elég kontrasztos régió. Élszerű régió (sajátértékekkel). | |||
== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | == Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | ||
A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük. | |||
*Minden pixelre kiszámoljuk a gradiens nagyságát és irányát. | |||
*A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz). | |||
*Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal. | |||
A jellemző orientációja az így készült hisztogram maximumánál lesz. | |||
A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor. |