Számítógépes látórendszerek - Ellenőrző kérdések: Frekvenciatartomány
Mutassa be, hogy mit jelent egy kép frekvenciatere, hogyan kell értelmezni? (Képletekre nincs szükség).
Hogyan hat egy objektum pozíciója és orientációja a frekvenciatartománybeli képre?
A kép frekvenciatere megadja azon komplex exponenciális komponensek együtthatóját, amelyekből a kép előállítható. Két dimenziós kép esetén a frekvenciatartomány is két dimenziós lesz. Mivel egy kép diszkrét pontokból áll, ezért a frekvenciatartomány periodikus lesz, azonban ennek csak az első periódusát ábrázoljuk, mivel a többi nem tartalmaz plusz információt. Továbbá mivel a pixelek a képen nyilvánvalóan valós értékűek, ezért a frekvenciatartományban komplex konjugált párokat kell kapnunk. Egy kép frekvenciaterében az egyes komponensekhez hasonlóan az egy dimenziós esethez két jellemző tartozik: a fázis és az amplitúdó. Lényeges különbség azonban, hogy egy komponenst már két koordináta azonosítja (k és l). Ezek a koordináták határozzák meg a képtartományban a szinuszos hullámok orientációját (ha az egyik nulla, akkor tengelyirányú), illetve periódusát. Eltolás a képtartományban nincs hatással az amplitúdókarakterisztikára a frekvenciatartományban (csak a fázisra). A forgatás már hatással van mind a két jellemzőre, de az amplitúdó karakterisztika esetén egy képtartománybeli forgatás az amplitúdó karakterisztikában is egy forgatásként jelenik meg.
Mit jelent az FFT? Hogyan működik az algoritmus?
Mi a DCT, miben különbözik a DFT-től?
Hogyan működik a FCT?
Miért lehet jól alkalmazni ezt az algoritmust tömörítés során és hogyan?
FFT: Fast Fourier Transformation
Algoritmus működése: 2N méretű adathalmazon működik. Lényegében a problémát mindig megfelezi a páros és páratlan komponensek mentén, egészen addig, amíg már csak egy pár marad, amire már triviálisan számolható a feladat. Az így kapott eredményeken azonban minden fokozat végén pillangó műveleteket kell végezni. Két dimenziós esetben először vízszintes, majd függőleges irányban.
DCT vs DFT:
Koszinusz transzformáció esetén olyan, mintha a kép tükörképe lenne a kép után x és y irányban, ennek megfelelően, nincsenek olyan hirtelen ugrások, mint DFT esetén. További előnye, hogy valós értékeket kapunk, jobb tömörítést tesz lehetővé (kevesebb nagyfrekvenciás komponens a szélek miatt), illetve egyszerűbb is.
FCT: Fast Cosine Transform
- Szimmetrikus függvény
- DFT(2N)
- Pozitív tartomány
Adattömörítés
Jóval kisebb intenzitású nagyfrekvenciás komponensek, mivel nincs hirtelen átmenet a kép széleinél, mint DFT esetén. (kevesebb információt vesztünk el a nagyfrekvenciás komponensek eldobásával)
Hogyan lehet frekvenciatartományban szűrést végezni?
Mit jelent az alul- és felül-áteresztő szűrés?
Milyen jellegű zajok kiszűrésére van lehetőség frekvenciatartományban, és hogyan?
Szűrés frekvenciatartományban: Az egyes frekvenciatartománybeli komponenseket meghatározott értékekkel szorozzuk meg, attól függően, hogy milyen ezeknek az értékeknek az eloszlása (milyen frekvenciákon csillapít, átereszt, erősít) az egyes szűrőket csoportosíthatjuk. A szűrés frekvenciatartományban egy egyszerű szorzással valósítható meg, ellenben a képtartománnyal, ahol az konvolúcióval számítható.
Aluláteresztő szűrő: Ebben az esetben alacsonyabb frekvenciás komponensek súlya nagyobb, mint a magasabb frekvenciásoké.
Felüláteresztő szűrő: Ebben az esetben magasabb frekvenciás komponensek súlya nagyobb, mint az alacsonyabb frekvenciásoké.
Zajszűrés frekvenciatartományban: Periodikus zajok nagyon jól kiszűrhetőek és bár elméletileg ez megoldható lenne képtartományban is, de túl költséges lenne, mert nagyon nagy kernel kellene hozzá. Aluláteresztő szűrővel a nagyfrekvenciás zaj is jól kiszűrhető. Felüláteresztő szűrővel az élek, körvonalak jól meghatározhatóak.