„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés

102. sor: 102. sor:


== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? ==
A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük.
Minden pixelre kiszámoljuk a gradiens nagyságát és irányát. A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz).
Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal.
A jellemző orientációja az így készült hisztogram maximumánál lesz.
A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor.