„Számítógépes látórendszerek - Ellenőrző kérdések: Képillesztés” változatai közötti eltérés
a autoedit v2: fájlhivatkozások egységesítése, az új közvetlenül az adott fájlra mutat |
|||
(2 közbenső módosítás, amit egy másik szerkesztő végzett, nincs mutatva) | |||
71. sor: | 71. sor: | ||
[[ | [[File:Számítógépes_Látórednszerek_Képillesztés_Sarokdetektálás.PNG|600px]] | ||
== Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? == | == Milyen képtranszformációkat ismer? <br/>Ezek közül melyekre invariáns a Harris operátor? == | ||
102. sor: | 102. sor: | ||
== Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | == Mutassa be a SIFT algoritmus leíró generáló részét! Hogyan érjük el a forgatás invarianciát? == | ||
A leírót a kulcspont 16x16-os környezetéből készítjük. A leírónak is invariánsnak kell lennie! A leírót ezért a kulcspont skálafaktorához tartozó képből készítjük. | |||
*Minden pixelre kiszámoljuk a gradiens nagyságát és irányát. | |||
*A kulcspont körül gradienshisztogramot készítünk, ami 36 rekeszből áll(10fok egy rekesz). | |||
*Az egyes rekeszekhez az adott irányban lévő gradiens értékeket adjuk hozzá, és ezeket még súlyozzuk a kulcsponttól való távolsággal. | |||
A jellemző orientációja az így készült hisztogram maximumánál lesz. | |||
A leírót úgy generáljuk, hogy egy 16x16 os képrészletet 4x4-es részekre osztjuk, és azokban számoljuk a fenti metódussal az orientációkat. Ezekből álll össze a leíró vektor. |