„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés
102. sor: | 102. sor: | ||
== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | == Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | ||
A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük. | |||
Minden pixelre kiszámoljuk a gradiens nagyságát és irányát. A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz). | |||
Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal. | |||
A jellemző orientációja az így készült hisztogram maximumánál lesz. | |||
A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor. |