InfoMenInfoKeres

A VIK Wikiből
A nyomtatható változat már nem támogatott, és hibásan jelenhet meg. Kérjük, frissítsd a böngésződ könyvjelzőit, és használd a böngésző alapértelmezett nyomtatás funkcióját.

Ez az oldal a korábbi SCH wikiről lett áthozva.

Ha úgy érzed, hogy bármilyen formázási vagy tartalmi probléma van vele, akkor, kérlek, javíts rajta egy rövid szerkesztéssel!

Ha nem tudod, hogyan indulj el, olvasd el a migrálási útmutatót.


Információ keresés és feltárás

  • információ visszakeresés (infromation retrieval, IR): a felhasználó információs igényének minél pontosabb kielégítése; általában félstrukturált és strukturálatlan adatokon
  • ad hoc visszakeresés: meglévő dokumentumokon
  • fitering: értesítés újonnan érkező releváns dokumntumokről
  • releváns dokumentum: kielégíti az adott információs igényt
  • fedés (recall): a releváns dokumentumok hány százalékát adja vissza a rendszer
  • pontosság (precision): a visszaadott dokumentumok hány százaléka releváns
  • rangsorolás (ranking): a relevancia szerinti rendezés
  • term: egy kulcsszó a rendszerben
  • normalizált term frekvencia (tf): egy term milyen relatív gyakorisággal fordul elő egy dokumentumban (a dokumentum leggyakoribb termjére nézve)
  • inverz dokumentum frekvencia (idf): annak az inverze, hogy milyen gyakran szerepel egy term a rendszer dokumentumai között, Együtt: tf-idf
  • Boolean modell: megmondjuk, hogy melyik szavak legyenek benne a válaszként visszaadott dokumentumokban, és melyikek ne (diszjunktív normálforma (ÉS-ek VAGY-a) segítségével)
  • vektor modell: a dokumentum term-vektora és a keresés termvektora által bezárt szög koszinusza alapján sorrendezzük a válaszokat