„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés

← Régebbi szerkesztés

VizuálisWikiszöveges

@@ 71. sor: / 71. sor: @@
-[[Fájl:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]]
+[[File:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]]
 == Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? ==
@@ 85. sor: / 85. sor: @@
 **Nincs invariancia!
-== Ismertesse a SIFT eljárás képrészletdetektáló részét! Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
+== Ismertesse a SIFT eljárás képrészletdetektáló részét! <br/>Hogyan érjük el a skála invarianciát és a szubpixeles pontosságot? ==
+SIFT = Scale Invariant Feature Transform
+*Keressünk kulcspontokat
+**Érdekes (sarokszerű) legyen
+**Keressünk skálainvariáns módon
+*Készítsünk minden régióhoz egy leírót, ami intenzitás, skála és rotáció invariáns
+Sarokdetektálást végezzünk el több skálafaktor mellett. Ezt a skálafaktort tároljuk el az egyes jellemzőkhöz. Difference of Gaussians, azaz két eltérő szélességű (szórású) gauss szűrő különbsége - Valóságban gauss-szal szűrt képek kivonása. A DoG szűrő maximuma ott lesz a skálatérben, ahol az objektum mérete egybeesik a szűrő inflexiós pontjával → Ez lesz a jó skála!
+Kulcspontok pozíciójában szubpixeles pontosságot követelünk meg! Interpolációra lesz szükség három dimenzióban (x,y,skála)
+Az így megtalált kulcspontokat szűrni kell! Nem elég kontrasztos régió. Élszerű régió (sajátértékekkel).
 == Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
+A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük.
+*Minden pixelre kiszámoljuk a gradiens nagyságát és irányát.
+*A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz).
+*Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal.
+A jellemző orientációja az így készült hisztogram maximumánál lesz.
+A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor.