Syntax highlighting of Archiv/Dokumentografické informační systémy

{{predmet|Dokumentografické informační systémy|Michal Kopecký|DBI010}}

'''Dokumentografické informační systémy''' zahrnují:
* úvodní teorii o tom, jak je těžké hledat dokumenty
* algoritmy pro vyhledávání v textu
** Knuth-Morris-Pratt
** Boyer-Moore
** Aho-Corrasick
** Commentz-Walter
** konečné automaty (+dvojcestné se skokem)
* modely DIS
** boolský (proximitní omezení, tezaurus)
** vektorový
*** různé míry
*** indexování, dotazy nad tím, zpětná vazba
*** ekvivalence a hierarchie termů
*** shlukování dokumentů (Kohonenovy mapy, C<sup>3</sup>M, sférický k-mean algoritmus)
** další modely vycházející z vektorového (induktivní model, sémantické sítě)
** další modely vycházející z boolského (fuzzy model, MMM, paice, rozšířená boolská logika)
* odstranění závislosti na termech
** v boolském modelu &ndash; síť konceptů
** ve vektorovém modelu &ndash; signal value decomposition, latent semantic indexing
* signatury
* distribuované DIS
** horizontální, vertikální a kombinovaná fragmentace
** integrované DIS, optimální vyhledávání, různé metriky
* vyhledávání v HTML (využití hypertextu, PageRank, HITS)
* komprese v DIS (Fibonacciho kódování, Eliasovy kódy, Huffmanovo kódování, HuffWord [http://uncyclopedia.org/wiki/Kitten_huffing]
* neurovové sítě a DIS
* prokletí dimenze (pyramidová technika, IGrid)

== Odkazy ==
*[http://www.ms.mff.cuni.cz/~kopecky/vyuka/dis/ stránka předmětu] (včetně 506 slidů prezentace)