Syntax highlighting of Archiv/Státnice I3: Vyhledávání a extrakce informací

{{Stub}}
{{TOC float}}

{{Sources|''Velkou část otázky pokrývá předmět [[Dokumentografické informační systémy]] [[Michala Kopeckého]] -- [[User:Rajjo|rajjo]] 17:37, 29 Aug 2010 (CEST)''
* slidy k předmětu [http://www.ms.mff.cuni.cz/~kopecky/vyuka/dis/ Dokumentografické informační systémy]
* [[wen:Information_retrieval]]
}}

== Informační systémy ==
* Faktografické vs. dokumentografické
* Zpřístupnění vs. dodání dokumentu
* Indexace nutná -- termy
** řízená, neřízená
** tezaury
* Kritérium predikce + maxima
* Precision, recall
== Vyhledávání v textu ==
* Triviální algoritmus
* Knuth-Morris-Pratt
* Aho-Corrasicková
== Boolské informační systémy ==
* Dokument reprezentován množinou termů, které ho vystihují
* Dotazy: AND, OR, NOT, wildcards, víceslovné, proximitní omezení, tezaurus, lemmatizace
* Invertovaný indexový soubor (org. po termech)
* Uspořádání výsledků (DNF, počet splněných konjunkcí)
* Zpětná vazba
== Vektorové informační systémy ==

----

{{Statnice I3}}