Syntax highlighting of Archiv/Dokumentografické informační systémy

{{predmet|Dokumentografické informační systémy|Michal Kopecký|DBI010}}

'''Dokumentografické informační systémy''' zahrnují:
* úvodní teorii o tom, jak je těžké hledat dokumenty
* algoritmy pro vyhledávání v textu
** Knuth-Morris-Pratt
** Boyer-Moore
** Aho-Corrasick
** Commentz-Walter
** konečné automaty (+dvojcestné se skokem)
* modely DIS
** boolský (proximitní omezení, tezaurus)
** vektorový
*** různé míry
*** indexování, dotazy nad tím, zpětná vazba
*** ekvivalence a hierarchie termů
*** shlukování dokumentů (Kohonenovy mapy, C<sup>3</sup>M, sférický k-mean algoritmus)
** další modely vycházející z vektorového (induktivní model, sémantické sítě)
** další modely vycházející z boolského (fuzzy model, MMM, paice, rozšířená boolská logika)
* odstranění závislosti na termech
** v boolském modelu &ndash; síť konceptů
** ve vektorovém modelu &ndash; signal value decomposition, latent semantic indexing
* signatury
* distribuované DIS
** horizontální, vertikální a kombinovaná fragmentace
** integrované DIS, optimální vyhledávání, různé metriky
* vyhledávání v HTML (využití hypertextu, PageRank, HITS)
* komprese v DIS (Fibonacciho kódování, Eliasovy kódy, Huffmanovo kódování, HuffWord [http://uncyclopedia.org/wiki/Kitten_huffing]
* neurovové sítě a DIS
* prokletí dimenze (pyramidová technika, IGrid)

Zkouška je ústní s papírem. Dostanete dvě otázky, pak nad nimi dumáte a píšete. Když jste vytlačili vše, přisedne Kopecký k vám, pročte papír a u slabých míst se vás doplňujícími dotazy snaží navést k poznání. V případě potřeby nechá čas na další promyšlení.

== Odkazy ==
*[http://www.ms.mff.cuni.cz/~kopecky/vyuka/dis/ stránka předmětu] (včetně 533 slidů prezentace)

=== Vizualizace algoritmu ===
*[http://www-sr.informatik.uni-tuebingen.de/~buehler/BM/BM.html Boyer-Moore]
*[http://www-sr.informatik.uni-tuebingen.de/~buehler/AC/AC.html Aho-Corrasick]

All of my questions settled-tanhks!